返回

第2047章 携程的技术暗战

首页
关灯
护眼
字:
上一页 回目录 下一章 进书架
来越密。

    她看了十几秒,把目光移开。

    “赵磊,你按我说的做。

    第一,把异常流量的特征全部记录下来,时间、频率、IP段、抓取的数据类型,每一条都要存。

    第二,先做限流,不要全封。

    把每IP每秒钟的请求次数限制在十次以内,超过的自动返回空数据。

    第三,你和小李小张分三班,二十四小时盯着。

    我不希望服务器在半夜挂了没人知道。”

    赵磊在笔记本上飞快地记下来,写完之后抬起头。

    “限流的话,会不会误伤真实用户?有些用户操作很快,一秒内可能会连续点好几个按钮。”

    “你先按十次来设,观察几个小时。

    如果误伤的情况严重,再调整到十五次。

    关键是不能让服务器挂掉。”

    赵磊点了点头,转过身开始敲键盘。

    俞飛鸿站起来,走到技术区外面的走廊里,拿出手机,给陈浩发了一条消息:“到了。

    赵磊在做了。”

    消息发出去之后,她靠在走廊的墙上,等着。

    走廊里的声控灯灭了,她没有跺脚,让自己站在黑暗中。

    大概过了十几秒,手机震动了。

    “好。

    流量日志发过来了吗?”

    “赵磊在准备。

    十分钟后发到你邮箱。”

    “收到。

    你找个地方坐一下,不要站着。

    你的腰不好。”

    俞飛鸿看着那行字,嘴角在黑暗中微微翘了一下。

    她走回技术区,在赵磊旁边的空椅子上坐下来,把手机放在桌上,屏幕朝上。

    反爬虫系统的升级工作比预想的要复杂得多。

    赵磊带着团队连续工作了三天三夜,写出了一个新的访问频率控制系统,部署在服务器的最前端。

    每一秒钟,系统都要处理几百个请求,对每一个请求做实时分析——

    IP地址、请求频率、访问路径、USer-Agent、行为模式——

    全部算一遍,在零点几秒内做出判断:是真实用户还是爬虫?是放行还是拦截还是限流?

    第一天,系统上线之后运行了不到两个小时,就出现了问题。

    限流阈值设得太低了,一些真实用户在短时间内连续操作被误判为爬虫,页面打不开,投诉电话打了进来。

    赵磊紧急把阈值从十次调到了十五次,又调到了二十次,观察了两个小时,误伤的情况减少了,但服务器的负载又上去了。

    他在阈值和服务器的承载能力之间反复调整,像是在走一根细钢丝,往左偏一点会摔,往右偏一点也会摔。

    【跪求礼物,免费的为爱发电也行!】
上一页 回目录 下一章 存书签