欢迎来到【互互助平台源码】【学源码账号】【涟源码头】10086源码-皮皮网网站!!!

皮皮网

【互互助平台源码】【学源码账号】【涟源码头】10086源码-皮皮网 扫描左侧二维码访问本站手机端

【互互助平台源码】【学源码账号】【涟源码头】10086源码

2024-12-24 09:36:40 来源:{typename type="name"/} 分类:{typename type="name"/}

1.面试官说:你来设计一个短链接生成系统吧

10086源码

面试官说:你来设计一个短链接生成系统吧

       引言

       相信大家在生活中,源码特别是源码最近的双十一活动期间,会收到很多短信,源码而那些短信都有两个特征,源码第一个是源码几乎都是垃圾短信,这个特点此处可以忽略不计,源码互互助平台源码第二个特点是源码链接很短,比如下面这个:

       我们知道,源码短信有些是源码有字数限制的,直接放一个带满各种参数的源码链接,不合适,源码另外一点是源码,不想暴露参数。源码好处无非以下:

       太长的源码学源码账号链接容易被限制长度

       短链接看着简洁,长链接看着容易懵

       安全,源码不想暴露参数

       可以统一链接转换,当然也可以实现统计点击次数等操作

       那背后的原理是什么呢?怎么实现的?让你实现这样的系统,你会怎么设计呢?来自于某鹅场面试官

短链接的原理短链接展示的逻辑

       这里最重要的知识点是重定向,先复习一下/tzHLFw与/gmccapp/webpage/payPhonemoney/index.html?channel=之间的装换是怎么样的呢?前面路径不变,变化的是后面,也就是tzHLFw与gmccapp/webpage/payPhonemoney/index.html?channel=之间的转换。

       实际也很简单,就是数据库里面的一条数据,一个id对应长链接(相当于全局的发号器,全局唯一的ID):

idurl1/gmccapp/webpage/payPhonemoney/index.html?channel=

       这里用到的,也就是我们之前说过的分布式全局唯一ID,如果我们直接用id作为参数,涟源码头貌似也可以:/1,访问这个链接时,去数据库查询获得真正的url,再重定向。

       单机的唯一ID很简单,用原子类AtomicLong就可以,但是分布式的就不行了,简单点可以用 redis,或者数据库自增,或者可以考虑Zookeeper之类的。

id 转换策略

       但是直接用递增的数字,有两个坏处:

       数字很大的时候,还是学习源码app很长

       递增的数字,不安全,规律性太强了

       明显我们平时看到的链接也不是数字的,一般都是大小写字母加上数字。为了缩短链接的长度,我们必须把id转换掉,比如我们的短链接由a-z,A-Z,0-9组成,相当于进制的数字,将id转换成为进制的数字:

publicclassShortUrl{ privatestaticfinalStringBASE="abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";publicstaticStringtoBase(longnum){ StringBuilderresult=newStringBuilder();do{ inti=(int)(num%);result.append(BASE.charAt(i));num/=;}while(num>0);returnresult.reverse().toString();}publicstaticlongtoBase(Stringstr){ longresult=0;for(inti=0;i<str.length();i++){ result=result*+BASE.indexOf(str.charAt(i));}returnresult;}publicstaticvoidmain(String[]args){ //tzHLFwSystem.out.println(toBase("tzHLFw"));System.out.println(toBase(L));}}

       id转 位的key 或者key装换成为id都已经实现了,不过计算还是比较耗时的,不如加个字段存起来,于是数据库变成了:

idkeyurltzHLFw/gmccapp/webpage/payPhonemoney/index.html?channel=

       但是这样还是很容易被猜出这个id和key的对应关系,要是被遍历访问,那还是电子查询源码很不安全的,如果担心,可以随机将短链接的字符顺序打乱,或者在适当的位置加上一些随机生成的字符,比如第1,4,5位是随机字符,其他位置不变,只要我们计算的时候,将它对应的关系存到数据库,我们就可以通过连接的key找到对应的url。(值得注意的是,key必须是全局唯一的,如果冲突,必须重新生成)

       一般短链接都有过期时间,那么我们也必须在数据库里面加上对应的字段,访问的时候,先判断是否过期,过期则不给予重定向。

性能考虑

       如果有很多短链接暴露出去了,数据库里面数据很多,这个时候可以考虑使用缓存优化,生成的时候顺便把缓存写入,然后读取的时候,走缓存即可,因为一般短链接和长链接的关系不会修改,即使修改,也是很低频的事情。

       如果系统的id用完了怎么办?这种概率很小,如果真的发生,可以重用旧的已经失效的id号。

       如果被人疯狂请求一些不存在的短链接怎么办?其实这就是缓存穿透,缓存穿透是指,缓存和数据库都没有的数据,被大量请求,比如订单号不可能为-1,但是用户请求了大量订单号为-1的数据,由于数据不存在,缓存就也不会存在该数据,所有的请求都会直接穿透到数据库。如果被恶意用户利用,疯狂请求不存在的数据,就会导致数据库压力过大,甚至垮掉。

       针对这种情况,一般可以用布隆过滤器过滤掉不存在的数据请求,但是我们这里id本来就是递增且有序的,其实我们范围大致都是已知的,更加容易判断,超出的肯定不存在,或者请求到的时候,缓存里面放一个空对象也是没有问题的。

       作者简介: 秦怀,公众号秦怀杂货店作者,技术之路不在一时,山高水长,纵使缓慢,驰而不息。个人写作方向:Java源码解析,JDBC,Mybatis,Spring,redis,分布式,剑指Offer,LeetCode等,认真写好每一篇文章,不喜欢标题党,不喜欢花里胡哨,大多写系列文章,不能保证我写的都完全正确,但是我保证所写的均经过实践或者查找资料。遗漏或者错误之处,还望指正。