第67节(3 / 4)
那两人还在聊着,沛诚支着半只耳朵听,心里却在走神。
回想起当时聊到这个人的场景,沛诚记得自己是在问基尘引擎的数据储存问题,森泽航解释说另有其人写出了核心算法,使得本来一直存在于理论之中的量子存储成为可能。但李翀汶一个社科转生命科学的人,是怎么跨界到量子物理去的?
而且在普林斯顿读生命科学的,分明不应该是……
“听说你是政经的,厉害啊,ppl专业,当时我报考了没被录进去。”李翀汶忽然一个问题丢到沛诚头上,打断了他的思路,“你们学院是不是最近有个研究项目在模型解释技术上?”
“啊?是的。”沛诚愣了一下,老实说:“不好意思我刚才在发呆。”
李翀汶不在意地笑起来:“哈哈没关系。”
沛诚发现这人真的很爱笑——许是最近在户外呆的时间多,李翀汶笑起来一口白牙特别显眼,看着就很好相处,估计在同性异性之中都很受欢迎。
然而饶是沛诚没在听,对于基尘的构建和设想他也熟悉得很,自觉补充道:“不过你说的那个项目研究方向不太一样,虽然听名字是模型解释技术,但其实内容更加侧重加强人工智能深度学习模型的决策过程,包括基于注意力机制、梯度等方法的模型解释技术。”他想了想,又说:“按照设想,这项技术的应用领域实践主要还是集中在医疗诊断、金融风险评估、司法决策等这一类的,对于前者,目前比较有希望落地的项目是在圣托马斯医院的每一个医院的科室……或者至少在外科手术室里配备人工智能手术机器人,辅助主刀医生快速分析数据并且做出判断。那么原来某些高难度的手术或许全医院只有两三个医生能做,这样一来就可以有更多医生能够完成了。至于后者,虽然应用的方式不同,但目的是一样的,都是助于提高决策的透明度和可信度。”
“哦?”李翀汶和森泽航看着都很感兴趣,森泽航:“之前没听你说过,好像很有意思的样子。”
沛诚耸耸肩道:“这个项目我没实际参与,只简单了解一点。不过这可能和你们俩感兴趣的方向不太一样,你们的话……应该还是nlp更加对口吧,自然语言理解,比如语言模型的预训练以及多模态语言理解,或者如何提高模型的效率、性能和泛化能力,以及如何将语言理解与视觉、声音和环境理解相结合,提高智能理解能力这一类的。”
李翀汶认真地听完,忽然问:“你的论坛id叫什么?”
沛诚摇头:“我不在论坛里,我是坛友家属,过来帮你们端咖啡的。”见李翀汶显得很意外,他又指指森泽航:“其他的我都是听他说的。”
李翀汶由衷地感慨道:“真厉害,一下就能明白我想问的是什么,而且你刚才还在发呆。”
沛诚也笑起来:“都说了在发呆对不起了!”
“那伦理框架和规范呢?”李翀汶饶有兴趣地问,“这不是你们ppl的老本行吗?”
“呃……是的,”沛诚叹了口气,“相关的研究和讨论确实很多,但如果是我内心最真实的想法……”
李翀汶:“嗯?”
“我认为伦理问题不是人工智能发展的最大优先级,人工智能又没有生物生存和繁衍的本能,在发展技术之前去设想伦理约束这本身就是反直觉。与其担心机器人大军会不会奴役人类,还是考虑一下更实际的应用问题比较关键。”沛诚坦言道,“只要从算法的公平性和公正性出发,确保不会带有偏见和歧视就可以了,其他的问题都迎刃而解。”
“不对劲吧,说回到语言模型的训练,那也都是以投喂海量数据来训练的。既然无论是历史数据还是使用数据,都是由带有偏见和歧视的真人所生成的,模型学习之后难道还能自己有判断能力,通过算法将一些结构性的偏见问题排除掉吗?”提出这一质疑的却是森泽航。
沛诚想了想,道:“你说的也有道理,那么或许退一步说,看看你们这个人工智能最终的目的是什么了。是要创造一个纯洁无瑕、没有歧视和偏见的虚拟和平世界?还是别有用途。如果是前者,那么我感觉应该吸引不了多少用户,别说没有矛盾和分歧的环境从营销的角度上很难传播,一个每个人都同意尊重每个人的意见、毫无奖励机制的世界怎么会有趣呢?”
“就像游戏一样。”李翀汶很快明白了其中的关键所在。
“那么如果这未来将是一个产品,换言之他会被商品化,其实只要参与的用户有足够的知情权和同意权就可以了。在法律允许的范围内,成年人可以做出自己的判断和选择。”沛诚说。
“就像游戏氪金一样。”李翀汶笑起来。
沛诚余光瞥见森泽航炯炯有神盯着他的目光,后背禁不住有点冒汗——他平时不太和森泽航讨论这些事,怕影响他的想法,今天一没留神说太多了。这个亮晶晶的眼神他熟悉得很——一般而言要是旁边没有别人,森泽航就要上嘴啃他了。
“再比如说,你的草莓镇对吧?森泽航给我演示过,真挺厉害的。”沛诚硬着头皮继续说,“但是我禁不住想,如果未来这个世界被更广泛的用户测试,里面有很多人同时发生交互,所有使用数据包含无数条分支、无数种可能,不止有文字图象和声音,还连带最为细微的反射差别,反哺给ai帮助它深度学习,完成升级优化,那么它会变得越来越庞大。这些数据包含了太多往哪里存?还是说,如果把原始的feed删掉,只留一个已经完成学习了的ai,那么没有原始数据的模型,真的能保证它的行为决策仍旧会保持一致吗?”
沛诚问出了他上一次也问过的问题。
很显然,目前的李翀汶对此还没有答案,但已经能摸到一点边:“这个我也很困扰,目前的技术应该还不能达到,只有几种潜在的可行方向。比如说量子储存,如果能够实现,就能极大压缩存储空间,但目前这项技术还只是一个假设。”
沛诚听完点点头,表示自己在这方面不是专家,也不懂。
于是那两人又就着话题继续讨论起来,沛诚安静地喝自己面前的咖啡,不再多说什么。
作者有话说: ↑返回顶部↑
回想起当时聊到这个人的场景,沛诚记得自己是在问基尘引擎的数据储存问题,森泽航解释说另有其人写出了核心算法,使得本来一直存在于理论之中的量子存储成为可能。但李翀汶一个社科转生命科学的人,是怎么跨界到量子物理去的?
而且在普林斯顿读生命科学的,分明不应该是……
“听说你是政经的,厉害啊,ppl专业,当时我报考了没被录进去。”李翀汶忽然一个问题丢到沛诚头上,打断了他的思路,“你们学院是不是最近有个研究项目在模型解释技术上?”
“啊?是的。”沛诚愣了一下,老实说:“不好意思我刚才在发呆。”
李翀汶不在意地笑起来:“哈哈没关系。”
沛诚发现这人真的很爱笑——许是最近在户外呆的时间多,李翀汶笑起来一口白牙特别显眼,看着就很好相处,估计在同性异性之中都很受欢迎。
然而饶是沛诚没在听,对于基尘的构建和设想他也熟悉得很,自觉补充道:“不过你说的那个项目研究方向不太一样,虽然听名字是模型解释技术,但其实内容更加侧重加强人工智能深度学习模型的决策过程,包括基于注意力机制、梯度等方法的模型解释技术。”他想了想,又说:“按照设想,这项技术的应用领域实践主要还是集中在医疗诊断、金融风险评估、司法决策等这一类的,对于前者,目前比较有希望落地的项目是在圣托马斯医院的每一个医院的科室……或者至少在外科手术室里配备人工智能手术机器人,辅助主刀医生快速分析数据并且做出判断。那么原来某些高难度的手术或许全医院只有两三个医生能做,这样一来就可以有更多医生能够完成了。至于后者,虽然应用的方式不同,但目的是一样的,都是助于提高决策的透明度和可信度。”
“哦?”李翀汶和森泽航看着都很感兴趣,森泽航:“之前没听你说过,好像很有意思的样子。”
沛诚耸耸肩道:“这个项目我没实际参与,只简单了解一点。不过这可能和你们俩感兴趣的方向不太一样,你们的话……应该还是nlp更加对口吧,自然语言理解,比如语言模型的预训练以及多模态语言理解,或者如何提高模型的效率、性能和泛化能力,以及如何将语言理解与视觉、声音和环境理解相结合,提高智能理解能力这一类的。”
李翀汶认真地听完,忽然问:“你的论坛id叫什么?”
沛诚摇头:“我不在论坛里,我是坛友家属,过来帮你们端咖啡的。”见李翀汶显得很意外,他又指指森泽航:“其他的我都是听他说的。”
李翀汶由衷地感慨道:“真厉害,一下就能明白我想问的是什么,而且你刚才还在发呆。”
沛诚也笑起来:“都说了在发呆对不起了!”
“那伦理框架和规范呢?”李翀汶饶有兴趣地问,“这不是你们ppl的老本行吗?”
“呃……是的,”沛诚叹了口气,“相关的研究和讨论确实很多,但如果是我内心最真实的想法……”
李翀汶:“嗯?”
“我认为伦理问题不是人工智能发展的最大优先级,人工智能又没有生物生存和繁衍的本能,在发展技术之前去设想伦理约束这本身就是反直觉。与其担心机器人大军会不会奴役人类,还是考虑一下更实际的应用问题比较关键。”沛诚坦言道,“只要从算法的公平性和公正性出发,确保不会带有偏见和歧视就可以了,其他的问题都迎刃而解。”
“不对劲吧,说回到语言模型的训练,那也都是以投喂海量数据来训练的。既然无论是历史数据还是使用数据,都是由带有偏见和歧视的真人所生成的,模型学习之后难道还能自己有判断能力,通过算法将一些结构性的偏见问题排除掉吗?”提出这一质疑的却是森泽航。
沛诚想了想,道:“你说的也有道理,那么或许退一步说,看看你们这个人工智能最终的目的是什么了。是要创造一个纯洁无瑕、没有歧视和偏见的虚拟和平世界?还是别有用途。如果是前者,那么我感觉应该吸引不了多少用户,别说没有矛盾和分歧的环境从营销的角度上很难传播,一个每个人都同意尊重每个人的意见、毫无奖励机制的世界怎么会有趣呢?”
“就像游戏一样。”李翀汶很快明白了其中的关键所在。
“那么如果这未来将是一个产品,换言之他会被商品化,其实只要参与的用户有足够的知情权和同意权就可以了。在法律允许的范围内,成年人可以做出自己的判断和选择。”沛诚说。
“就像游戏氪金一样。”李翀汶笑起来。
沛诚余光瞥见森泽航炯炯有神盯着他的目光,后背禁不住有点冒汗——他平时不太和森泽航讨论这些事,怕影响他的想法,今天一没留神说太多了。这个亮晶晶的眼神他熟悉得很——一般而言要是旁边没有别人,森泽航就要上嘴啃他了。
“再比如说,你的草莓镇对吧?森泽航给我演示过,真挺厉害的。”沛诚硬着头皮继续说,“但是我禁不住想,如果未来这个世界被更广泛的用户测试,里面有很多人同时发生交互,所有使用数据包含无数条分支、无数种可能,不止有文字图象和声音,还连带最为细微的反射差别,反哺给ai帮助它深度学习,完成升级优化,那么它会变得越来越庞大。这些数据包含了太多往哪里存?还是说,如果把原始的feed删掉,只留一个已经完成学习了的ai,那么没有原始数据的模型,真的能保证它的行为决策仍旧会保持一致吗?”
沛诚问出了他上一次也问过的问题。
很显然,目前的李翀汶对此还没有答案,但已经能摸到一点边:“这个我也很困扰,目前的技术应该还不能达到,只有几种潜在的可行方向。比如说量子储存,如果能够实现,就能极大压缩存储空间,但目前这项技术还只是一个假设。”
沛诚听完点点头,表示自己在这方面不是专家,也不懂。
于是那两人又就着话题继续讨论起来,沛诚安静地喝自己面前的咖啡,不再多说什么。
作者有话说: ↑返回顶部↑