科恩看着好友的表情,内心翻个白眼。
天,他真不想猜到发生了什么,但Ned和之前完全“两模两样”,Ada要真的身体不适,他绝不是这个样子。
下午实验结束,科恩搭上丹尼的肩膀,约他一起晚饭。
他跟梁思宇告别:“我晚点回去,帮我问Ada好。”
他可不想被两个好朋友秀一脸。
可惜,许瑷达倒是盼着他回来,她本来想三个人一起商量下后续研究计划的,不过,先探探梁思宇的想法也好。
吃过晚饭,她主动提议:“Ned,我们商量一下新学期的计划吧?”
梁思宇倒来两杯冰椰子水,坐到她对面。
许瑷达开门见山:“下学期,我们可以把硬件换成sEMG,数据精度更高。这方面我会和科恩再确认一下。”
“至于药物影响,我想先做阿得拉,参与者招募更容易。你怎么想?”
梁思宇却对曲唑酮更感兴趣。
这种药物既有助眠作用,又有镇痛功能,还能改善情绪,在截肢患者中使用率更高,明显更具有研究价值。
他再次感到一丝异样,她好像,真的有点着急。上学期,她流感没好全,就急着要补数据。
他了解她的科研品味,她肯定能看出曲唑酮更有研究意义,只是为了求快,她才想选阿得拉。
到底是为了什么呢?她不是那种图一时虚名、短暂浮利的人。
“Ada,”他犹豫了一下,握住了她的手,“我总感觉,你今年好像有点着急,你在担心什么?”
“或者,是我感觉错了?不管怎么样,你愿意和我聊聊吗?”
许瑷达心情复杂,他向来细心,又了解她的喜好,总能在细枝末节上察觉些什么。幸好,他绝不会想到重生这么离谱的真相。
她嘴角微微一动,不过,在这件事上,她倒也不单单是为了“快速出成果”,而是有其他考量,这甚至是她上辈子都没有用过的方法。
她干脆地承认:“是,阿得拉的研究价值确实不如曲唑酮。但是,我想顺带验证一个新算法,从根源上解决数据稀缺性的问题。”
“你是想同时完成一篇方法学论文?用这个数据集来做验证?”
梁思宇马上明白了她的意思,她这是想一石二鸟,用一个数据集完成双重目的,发表两篇不同性质的论文。
不过,他也有不解之处:“等等,让我想想,RNN的迁移学习在其他药物上并不一定适应吧?这个算法不具有普适性吧?方法创新在哪里?”
许瑷达摇摇头:“不是你想的这种,是一种更激进的方法改进。我是想用GANs(对抗网络)训练一个肌电数据的生成器。”
她放慢语速,“我想证明,少量真实数据加大量生成数据,就能训练出有效的算法。”
“什么?!”梁思宇目瞪口呆。
他花了十几秒钟来消化这句话,眉头慢慢皱紧。
不,这不是激进,这简直是颠覆。照他看来,这完全不符合实证研究的基本原则。
许瑷达试着解释,GANs(对抗网络)需要训练两个互为对手的AI模型。
一种是生成器,基于普通的sEMG信号生成受阿得拉影响的信号,一种是判别器,来分辨这个信号到底是伪造器生成的还是真实信号。
两个模型互相攻防,迭代多次后,生成器产生的数据达到“以假乱真”的水平——判别器很难鉴定其真伪。
这时候,就可以用少量真实数据加大量生成数据来训练算法,从根源上解决特殊参与者训练数据不足、数据收集困难的问题。
“思路上我明白了,”梁思宇非常犹豫,“可是,这有点像一种数字游戏。”
“用虚拟生成数据来训练运动控制算法?怎么确保它们和真实数据一致?”
他点破自己的担忧:“判别器不能分辨,也许不是虚拟数据足够仿真,而是你的判别器不够聪明呢?”
许瑷达点头:“所以,我们还是要招募阿得拉的使用者,收集真实数据。你就当我的GANs算法在搭便车,做不出来也没损失,对不对?”
“到时候,如果用它生成的虚拟数据和真实数据训练出来的算法一样好,你是不是可以承认,我的方法是有效的?”
梁思宇叹了口气,听她这意思,是准备私下完成,才向导师汇报,可见她自己也知道成功率不高。
这是刚发表一年的新算法,万一算法本身有问题呢?况且,她完成了算法,也得投稿啊,审稿人那一关呢?他觉得这个做法真的很冒险。
他劝道:“Ada,你也得想想投稿的问题,审稿人恐怕会觉得这方法不够严谨。起码,医学期刊上,据我所知,没有人会接受虚拟数据。”
她有些不舒服,微微提高了音量:“那是你们既傲慢,又无知,不肯看看其他领域的进步。”
她怎么这么倔呢?他扶着额头:“你就准备这么回复审稿人?”
“行了行了,我就私下说说。”她也承认自己不过是逞口舌之快。
其实她不准备投医学期刊,这个适合nature、PNAS这种综合型期刊。不过,涉及药物和医学,还是可能遇到医学方向的审稿人。
她眼珠一转,神秘兮兮地笑了,像只小狐狸。她干脆绕过餐桌,坐到他膝上。
“Ned,你来想想怎么应付审稿人,好不好?”她抱住他脖子,轻轻摇晃。
“你想得美!”梁思宇无奈地扶住她的腰,让她坐更稳。这个小坏蛋,老喜欢把这种解释类的写作任务扔给他。
他点一下她眉心,“还审稿人呢?先想想怎么说服布鲁克教授吧。”
“可行性啊。”她理直气壮地说,“阿得拉的参与者容易找,干净的曲唑酮对照组可不容易吧?”