
亚马逊沐神 | 博士这五年来源:https://zhuanlan.zhihu.com/p/25099638
12年8月提着一个行李箱降落在匹兹堡机场 。 没找住的地方 , 也不知道CMU应该怎么去 。 对未来一片迷茫 , 但充满乐观 。现在 , 刚完成了博士期间最后的一场报告 , 在同样的机场 , 不过是在等待离开的航班 。
回想过去的五年 , 是折腾的五年 , 也是自我感悟和提升的五年 。 这里我尝试记录这五年主要做过的事情和其中的感想 , 希望对大家有所启发 。
第0年:3/11-8/12
我第一次申请美国的博士是在11年 , 但拿到的offer并没有特别合适的导师 , 于是就北上投奔文渊去了 。我当时在百度商务搜索部门做广告的点击预估 。 具体是使用机器学习来预测一个广告是不是会被用户点击 。这时候离“大数据”这个词流行还有两年 , 但百度那时候的数据即使现在来看仍然是大的 。 我的任务是如何高效的利用数百台机器快速的在数十T的数据上训练出模型 。
当时产品用的算法基于LBFGS , 我于是想是不是可以换个收敛更快的算法 。 没几天就找到个不错。 但实现上发现了各种问题 , 包括性能 , 收敛 , 和稳定性 。 而且那时有的就是一个裸的Linux和很老版本的GCC , 什么都是需要从头开始写 。 花了大量时间做系统优化 , 算法改动 , 和线上实验 , 最后一年后在整个广告流量上上了线 。
现在再回顾会觉得整个一年时间都在打磨各种细节上 , 有时候为了5%的性能提升花上上千行代码 。 这些都导致算法过于复杂 , 有过度设计之嫌 。 但深入各个细节对个人能力提升很大 , 而且很多遇到的问题成为了之后研究方向的来源 。 一些算法上的思考曾写在这里 , 当时候深度学习刚刚出来 , 冥冥中觉得这个应该是大规模机器学习的未来 , 不过真正开始跟进是好几年以后了 。
11年12月中的时候突然心血来潮随手把材料重新寄了一遍 , 就选了CMU和MIT , 结果意外收到了CMU的offer 。 有天在百度食堂同凯哥(余凯)和潼哥(张潼)吃饭 , 我说收了CMU offer , 在纠结去不去 。 他们立马说去跟Alex Smola啊 , 他要要加入CMU了 , 我们给你引荐下 。
记得是离开的前一天才开始打包行李 , 早上去公司开完会 , 中午离职 , 跟小伙伴打招呼说出个国 , 然后就奔机场了 。 那天北京天气特别好 , 完全不记得前一天雾霾刚爆了表 。
第一年:9/12-8/13
第一年的主要事情是熟悉环境和上课 。 CMU课程比较重 , 博士需要学8门课 , 每门课工作量巨大 。 而且要求做两门课助教 , 做助教比上课更累 。
这一年上的课中对我最有用的是“高级分布式系统” 。 之前在上交ACM班的时候已经学过很多质量都还不错课 , 纯知识性的课程一般对我帮助不大 。 但这门课主要是读论文 , 然后大家讨论 。 不仅仅是关于知识 , 很多是对设计理念的领悟 。 大家知道对于系统而言 , 设计是一门艺术而不是科学 , 这是设计者审美和哲学理念的体现 。 同时系统界历史也是由一波又一波的潮流组成 , 了解历史的发展以及其中不断重复的规律非常有意义 。
那年这门课上课老师是Hui Zhang(神人之一 , 20多岁就在CMU任教了 , 学生包括了Ion Stoica , 他是Spark作者Matei的导师) , 他有非常好的大局观 , 对于“Why”这个问题阐述非常到位 。 我是通过这门课才对分布式系统有了比较清晰的认识 。 两年之后我偶然发现我的一篇论文也在这门课的阅读列表里了 , 算是小成就达成。
- ChatGPT创建的儿童读物《Alice and Sparkle》上架亚马逊
- 亚马逊|智能手表市场比武大会,华为小米新品亮相,OPPO还有一战之力吗?
- 亚马逊|亚马逊、速卖通、阿里国际自动和手动广告的核心是什么?自己养买家号测评的好处
- 亚马逊|上万品牌受影响!亚马逊再对中国卖家出手,苦日子还在后头?
- 软件|亚马逊 速卖通 虾皮担心测评不安全,平台是如何风控测评的?
- 亚马逊|亚马逊黑五网一销量再破记录!
- 亚马逊|家电市场孕育着一场场微观新变局
- 华为|华为再造神话:入局3个月,销量成行业王者,亚马逊也不行
- 华为|美国的亚马逊偷窃华为技术被逮捕了。
- 存储卡|寒冬中的亚马逊,开始学抖音卖货
