AI 人工智能写作三部曲:记忆、联想、创作

嘉宾 艾浒(老八)

北大 AI 人工智能开发者艾浒(老八)最近开发的一个人工智能写作软件似乎在知乎上引起了不小的波澜。

这集中老八分享了他开发这个软件的灵感和过程,他所理解的人工智能写作的三部曲:记忆、联想和创作,以及未来为什么是人工智能的?

我们的听众群小伙伴们也提了很多非常有启发性的问题:

  • 人工智能写作是否会影响小朋友的创造力?
  • AI 在写作时会不会去规避不正确的言论?
  • 人工智能会不会构成知识产权的侵犯?她的原创性能成立吗?

到 Apple 播客收听

到 Apple 播客收听

到喜马拉雅收听

播客概要

  1. 老八:北京大学计算机专业毕业。本名:艾浒。l8ai AI 写作软件创始人。8 月 5 日中午花了十分钟,写了一篇高考作文,发布到知乎上。有一家创业公司找我技术入股。中国移动联系我项目合作。一位投资人也找到我注册了公司。为了给机器人洗脱罪名,用我发明的人工智能写作工具写了一篇作文,并简述了机器人写作的方法,之后呢发布到知乎上。
  2. 主播:百灵是怎样一个工具?
    老八:百灵是一个人工智能写作工具。想让更多的文字工作者享受到人工智能的红利。甚至把所有的文字工作者都从繁重的脑力劳动中解放出来。最终我完成了 l8ai.com 的开发。
    开发过程中没有使用任何的开放平台或者人工智能云服务。全部的神经网络设计和训练全是我自主研发的算法,全都是我一个人用工作业余时间完成的。
    白灵的寓意就是数百个灵魂。当用户输入自己的文章以后,人工智能就会根据用户的文章进行联想,之后呈现出与用户文章语义相似的文学作品片段。这个百灵是我用了一亿三千万个神经元模仿了人类大脑的思维方式构建的。
  3. 主播:百灵能把找到的文本有逻辑性的整合在一起写成一篇完整的文章吗?
    老八:这个现在还不能。
  4. 主播:给数据做标签是一个庞大的工作,你是怎么做到这些的?
    老八:和出版社签了一个合同,准备出一本书,把这块的详细原理都说清楚。然后这本书详细讲解了人类大脑的思维方式,以及人工智能编程的实战技巧。我在这里简单说一下数据处理的原理。
    首先说一下人类大脑的思维方式,说到思维就先必须要说下记忆。关于记忆的存储有一个很著名的祖母细胞理论,祖母细胞是一种假象中的神经元群落。
    联想心理学认为一切复杂的心理现象都是通过联系复合起来的。记忆就是细胞群落,思维就是联想,联想的算法只有一条就是接近率。
  5. 主播:还是归到数据标签这件事,你有没有给数据做标签?
    老八:不用做标签,她是电脑训练出来的,不是人工标记出来的。
  6. 主播:那计算机怎么去辨别哪几个词是一个词组?
    老八:我现在分词用的是一个开源的工具,叫结巴分词,使用的是百度飞桨的内核。
  7. 主播:5月底 Open AI 推出的 GPT-3 文本生成神经网络引起了不小的轰动,他们就不用给文字做标签了。
    老八:其实 GPT-3 有一个缺点,就是训练成本实在太高了。另外呢,最近百度飞桨也提出一个新的模型。已经在很多评测上超过了 GPT-3 .
  8. 主播:你说百度做的已经超过 GPT-3 了,这个会不会有中文和英文的区别?或者是因为中国人口多,百度又是搜索引擎,所以它有庞大的数据?
    老八:还真不是,它那个评测是在英文数据集上做的。全世界的论文数量,中文已经第一了。
  9. 主播:一篇文章的好坏是非常主观的判断, AI 怎么去做到的?或者说引用很多名人名言就是好的文章吗?
    老八:我用的方法就是爬网,对于赞同数多的文学作品片段,在计算机联想相似度的时候,给这个分数加权 3-5% 。
  10. 主播:人工智能能定制出写作风格吗?
    老八:我觉得写作风格是专业文字工作者才具有的这么一种能力。对于绝大多数的普通人,其实写作都是从模仿开始的。写作的过程中要模仿很多东西,这些东西在模仿的过程中逐渐就形成了你自己的东西。最终才会形成自己独特的风格。百灵最基础的功能就是帮助你模仿。
  11. 主播:百灵可以运用在哪些场景中?
    老八:凡是与写作相关的领域都用的上。我们还和其他公司合作,对于图片它也能生成对应的文本。
  12. 主播:比如论文和一些学术性的文章呢,它更重于思维逻辑的推理而不是名句的引用?
    老八:我这里边现在没学那些东西,那些东西我准备后期再加进来,增强网站的能力。
  13. 主播:百灵你会独立开发下去,还是整合到商业项目中?你会希望把她做成一个怎样子的软件?
    老八:我现在还没定具体的目标,受众面大了以后再根据实际的需求,再进行下一步的战略考虑。
  14. 听众问题:人工智能写作是否会影响小朋友的创造力?
    老八:创造力源于联想,联想是人类发明与创造的催化剂。
  15. 主播:百灵和搜索引擎有什么区别?
    老八:可以理解为她是一个文学名著的搜索引擎。
  16. 主播:在百灵里面,能输入最长的文字限度是多少?
    老八:她现在限制是 500 个字。
  17. 听众问题:AI 在写作时会不会去规避不正确的言论?
    老八:文学名著中不正确的言论比较少,百灵中还有数十万的优质网络评论。(放大了,从人工智能来说)人工把几千万条几亿条数据做人工的标注。然后拿标注好的数据放到神经网络里去训练,
  18. 听众问题:人工智能会不会构成知识产权的侵犯?她的原创性能成立吗?
    老八:不会构成侵犯知识产权的,因为百灵的形式是引用。参照别人文章写出来的文章她也是值得保护的。
  19. 主播:用户用百灵写了一个作品,这个作品的版权属于软件的创造者还是用户?
    老八:肯定是属于用户的,因为用户不可能把软件创造的作品直接用,肯定要改的。要看(软件开发者)用的开源协议是哪个。
  20. 主播:如果听众就记住一句话,你希望他们记住什么?
    老八:两句话:
    • 人工智能的本质是一种生产工具。
    • 我们每个人的财富积累更根本的原因是能否抓住科技革命带来的机会。

联系主播 & 加入播客听众群

预知访谈嘉宾,提议你想问的问题。

Messages 信息联系更快捷

Apple 用户可以通过 Messages 信息直接联系主播。

发送你的语音留言,推荐自荐嘉宾,商业或个人合作,立即发 Messages 给我。

Messages 联系

如何使用 Messages 信息

重磅资讯

打开支付宝,扫码赞赏

支付宝播客赞赏

打开微信,扫码赞赏

微信播客赞赏