楼教主还是得上播客 – 杨肉的演讲台

楼天城和程曼祺在晚点的采访，有文章也有播客。播客大概1个半小时，聊了很多，当时就觉得这种采访最好还是直接听播客音频而不是看编辑自己总结的文章。今天看到了文章出来，确实没有直接听播客原始的采访音频更好。现在很多人只会拿一句话来抓眼球，没有智力或没有意愿深度探究的人就会被带节奏或者自己在那带节奏。有耐心且有智力的人还是能听出一个完整的故事线的，是否认同是另一回事。我甚至觉得很多时候采访者的智力如果不够的话，也是跟不上被采访者的思路的。

播客的链接是https://www.xiaoyuzhoufm.com/episode/676c92ed4e2405e3fde38272?s=eyJ1IjogIjYwMmJhY2I2ZTBmNWU3MjNiYjY0YmY1NCJ9

我这边试图用简单的故事线总结一下（但数学太差的话估计还是理解不了）：

0：人们对于AI的要求是双标的，AI必须做的比人更好，才能被接受。比如人类司机可以犯错甚至失能，AI不行，所以L4的要求是“比人类司机安全十倍”，是不是十倍不重要，但需要能处理得比人好，不能跟人类犯一样的错误。
1：L4的公司19年就能做到一两百公里接管一次，从而拍个视频或者让人体验，但再后面几年事故率降低几百上千倍并不会让外人觉得有明显的进步。而事实上到2024年再看，过去的5年进步就很明显，因为已经能做到上百到几百台车纯无人规模化运营Robotaxi了。
2：百度是几百台的无人车队规模，小马智行在100台左右的无人车规模，没有比百度车多并不是百度技术领先，而是因为目前的车型成本高大家做不到单车毛利为正，作为资金有限的创业公司Pony选择等能有更低成本的车辆实现毛利为正后再大规模扩充车队规模，也就是2025年。
3：用单纯堆数据的方式做自动驾驶，是“Learning by Watching”，上限也只能是开的跟人一样好，但是因为人类对AI的双标问题，他无法突破人类的能力，需要类似AlphaZero一样的自我对弈，也就是“Learning by Practicing”。具体是端到端还是什么算法不重要，重要的是如何优化算法。
4：L2靠“Learning by Watching”肯定够用，但是1000km接管一次的L2是一个反人性的产品，因为人类在这么低的频率面前是做不到及时接管的。
5：只用摄像头实现L4是不work的，因为摄像头远不如人类的眼睛耳朵等器官，只让人类看摄像头图像开车一样可能开不好。
最后：大多数人只是看结果是否好来去评价方法是否正确，所以不要盲目使用别人的方法。