1.面试官说:你来设计一个短链接生成系统吧
2.c语言程序设计教程答案c语言程序设计练习题
面试官说:你来设计一个短链接生成系统吧
引言
相信大家在生活中,源码特别是源码最近的双十一活动期间,会收到很多短信,源码而那些短信都有两个特征,源码第一个是源码几乎都是垃圾短信,这个特点此处可以忽略不计,源码indo run 源码分析第二个特点是源码链接很短,比如下面这个:
我们知道,源码短信有些是源码有字数限制的,直接放一个带满各种参数的源码链接,不合适,源码另外一点是源码,不想暴露参数。源码好处无非以下:
太长的源码链接容易被限制长度
短链接看着简洁,长链接看着容易懵
安全,源码不想暴露参数
可以统一链接转换,当然也可以实现统计点击次数等操作
那背后的原理是什么呢?怎么实现的?让你实现这样的系统,你会怎么设计呢?来自于某鹅场面试官
短链接的原理短链接展示的逻辑这里最重要的知识点是重定向,先复习一下/tzHLFw与/gmccapp/webpage/payPhonemoney/index.html?channel=之间的装换是怎么样的呢?前面路径不变,变化的是后面,也就是openwrt内核源码分析tzHLFw与gmccapp/webpage/payPhonemoney/index.html?channel=之间的转换。
实际也很简单,就是数据库里面的一条数据,一个id对应长链接(相当于全局的发号器,全局唯一的ID):
idurl1/gmccapp/webpage/payPhonemoney/index.html?channel=这里用到的,也就是我们之前说过的分布式全局唯一ID,如果我们直接用id作为参数,貌似也可以:/1,访问这个链接时,去数据库查询获得真正的url,再重定向。
单机的唯一ID很简单,用原子类AtomicLong就可以,但是分布式的就不行了,简单点可以用 redis,或者数据库自增,或者可以考虑Zookeeper之类的。
id 转换策略但是直接用递增的数字,有两个坏处:
数字很大的时候,还是很长
递增的数字,不安全,linux源码分析报告规律性太强了
明显我们平时看到的链接也不是数字的,一般都是大小写字母加上数字。为了缩短链接的长度,我们必须把id转换掉,比如我们的短链接由a-z,A-Z,0-9组成,相当于进制的数字,将id转换成为进制的数字:
publicclassShortUrl{ privatestaticfinalStringBASE="abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";publicstaticStringtoBase(longnum){ StringBuilderresult=newStringBuilder();do{ inti=(int)(num%);result.append(BASE.charAt(i));num/=;}while(num>0);returnresult.reverse().toString();}publicstaticlongtoBase(Stringstr){ longresult=0;for(inti=0;i<str.length();i++){ result=result*+BASE.indexOf(str.charAt(i));}returnresult;}publicstaticvoidmain(String[]args){ //tzHLFwSystem.out.println(toBase("tzHLFw"));System.out.println(toBase(L));}}id转 位的key 或者key装换成为id都已经实现了,不过计算还是比较耗时的,不如加个字段存起来,于是数据库变成了:
idkeyurltzHLFw/gmccapp/webpage/payPhonemoney/index.html?channel=但是这样还是很容易被猜出这个id和key的对应关系,要是被遍历访问,那还是很不安全的,如果担心,可以随机将短链接的字符顺序打乱,或者在适当的位置加上一些随机生成的字符,比如第1,4,5位是随机字符,其他位置不变,只要我们计算的安卓源码研究时候,将它对应的关系存到数据库,我们就可以通过连接的key找到对应的url。(值得注意的是,key必须是全局唯一的,如果冲突,必须重新生成)
一般短链接都有过期时间,那么我们也必须在数据库里面加上对应的字段,访问的时候,先判断是否过期,过期则不给予重定向。
性能考虑如果有很多短链接暴露出去了,数据库里面数据很多,这个时候可以考虑使用缓存优化,生成的时候顺便把缓存写入,然后读取的时候,走缓存即可,因为一般短链接和长链接的关系不会修改,即使修改,也是很低频的事情。
如果系统的simple_switch源码id用完了怎么办?这种概率很小,如果真的发生,可以重用旧的已经失效的id号。
如果被人疯狂请求一些不存在的短链接怎么办?其实这就是缓存穿透,缓存穿透是指,缓存和数据库都没有的数据,被大量请求,比如订单号不可能为-1,但是用户请求了大量订单号为-1的数据,由于数据不存在,缓存就也不会存在该数据,所有的请求都会直接穿透到数据库。如果被恶意用户利用,疯狂请求不存在的数据,就会导致数据库压力过大,甚至垮掉。
针对这种情况,一般可以用布隆过滤器过滤掉不存在的数据请求,但是我们这里id本来就是递增且有序的,其实我们范围大致都是已知的,更加容易判断,超出的肯定不存在,或者请求到的时候,缓存里面放一个空对象也是没有问题的。
作者简介: 秦怀,公众号秦怀杂货店作者,技术之路不在一时,山高水长,纵使缓慢,驰而不息。个人写作方向:Java源码解析,JDBC,Mybatis,Spring,redis,分布式,剑指Offer,LeetCode等,认真写好每一篇文章,不喜欢标题党,不喜欢花里胡哨,大多写系列文章,不能保证我写的都完全正确,但是我保证所写的均经过实践或者查找资料。遗漏或者错误之处,还望指正。
c语言程序设计教程答案c语言程序设计练习题
c语言程序设计教程答案,c语言程序设计练习题很多人还不知道,现在让我们一起来看看吧!c语言程序设计练习题
篇一:c语言程序设计基础单元总结与练习题及答案
《C语言程序设计》单元总结与练习题
答 案
单元一 程序设计宏观认识
单元总结提升
本单元中,核心内容有C语言程序框架结构、程序的构成和程序开发过程。通过本单元
的学习,我们应该知道: 1.C语言程序最基本的程序框架由两部分构成,分别是:
(1) 编译预处理
(2) 函数组
2.C程序最大的特点就是所有的程序都是用函数来装配的,函数是构成C语言程序的
基本单位,函数包括主函数、库函数和自定义函数。函数的一般结构形式为:
3.标识符是用来标识程序中的某个对象名字的字符序列。C语言把标识符分为三类,
即关键字、预定义标识符、用户自定义标识符。对于用户自定义标识符的命名C语言规
定:
(1) 所有的用户标识符必须先定义后使用;
(2) 用户标识符由字母(A~Z,a~z)、数字(0~9)、下划线“_”组成,并且首字符不
能是 数字 ;
(3) 区分大小写;
(
4)不能用关键字作为用户自定义标识符,通常不使用预定义标识符作为用户自定义
标识符。
4.理论上讲,程序开发过程分为四个步骤,分别为:
(1) 编辑源程序
(2) 编译源程序,生成目标程序
(3) 连接目标程序及其相关模块,生成可执行文件
(4) 运行可执行文件
5.简单描述使用VC++6.0开发应用程序的步骤:
如图所示:
总之,通过本单元的学习,应该掌握C语言程序框架结构和程序开发过程,还要对C
语言程序设计的知识脉络有一定的了解。
单元练习
一.选择题
1.构成C语言程序的基本单位是(c )。
A.框架 B.预处理 C.函数 D.语句
2.在程序开发过程中,把文本文件格式源程序转化为二进制格式的目标程序的过程称之为( b )。
A.编辑B.编译 C.连接 D.运行
3.关于主函数,下列说法不正确的是( c )。
A.一个完整的C语言应用程序有唯一的主函数
B.主函数的名称只能是main
C.主函数可以被其他自定义函数调用
D.C语言程序的运行从主函数开始,以主函数为核心展开
4.关于标识符,下列说法不正确的是( c )。
A.库函数名称为预定义标识符,不建议用作用户自定义标识符
B. 关键字不能作为用户自定义标识符
C.用户自定义标识符中不区分大小写字母
D.标识符中可以出现下划线,且可以出现在标识符的任意位置
5.以下可用作用户自定义标识符的一组是( c )。
A.void、return、if
B.printf、include、fabs D.2abc、pay$、sum- C.Max、_abc、Main
二.填空题
1.C语言程序一般由若干个函数构成,程序中应至少包含一个_________,其名称只能为
_________。
2.C语言程序中每条语句必须以_________结束。
3.C语言程序的注释是以_________开头,以________结束的,在VC++6.0编程环境中,可使用_________作为注释的起始标识,注释对程序的执行不起任何作用。
4.最初编写的C语言程序称为_________,其扩展名为_________,编译后生成的文件为_________,其扩展名是_________,连接后生成的文件是_________,其扩展名是_________。
5.C语言规定,标识符只能由_________、_________和_________三种字符组成,而且,首字符只能是_________或_________。