article_image

【本周 AI 消息】为 Untag 试验性栏目,内容来自会员 @BoranCui 的投稿。

本期内容主要介绍了最近几项人工智能技术的发展,包括BloombergGPT、阿里正在研发的大规模语言模型、微软开源的贾维斯以及 Vicuna-13B 等。此外,新的随想板块中也将由编辑大宇来讨论社交媒体和 ChatGPT 对青少年心理健康的影响,提出了对人工智能技术的警惕。


本周科技消息

1. 彭博发布BloombergGPT

https://s2.loli.net/2023/04/07/krsFe42JhOcpnUH.png

BloombergGPT是一个专门为金融领域设计的大型语言模型(LLM),它可以支持多种自然语言处理任务,如情感分析、命名实体识别、新闻分类和问答等。BloombergGPT是基于BLOOM、架构的解码器模型,包含70层变换器解码器块,具有多头自注意力、层归一化和一个隐藏层的前馈网络。

BloombergGPT的参数量达到500亿,比2020年OpenAI的GPT-3(约500亿参数)还要大。BloombergGPT是利用Bloomberg庞大的数据源构建了一个3630亿token的金融数据集进行训练的,这可能是目前最大的领域特定数据集。此外,BloombergGPT还使用了来自其他来源的3450亿token的通用数据集进行训练,包括数百个英文新闻源、The Pile(包括YouTube字幕、古腾堡计划和维基百科的完整副本等)等。BloombergGPT在标准的LLM基准测试、开放的金融基准测试和一系列内部基准测试上都表现出色,显著超过了现有的模型,在金融任务上具有很强的优势,同时也没有牺牲在通用LLM基准测试上的性能。

BloombergGPT是金融行业开发和应用这种新技术的第一步,将为Bloomberg终端上海量数据的利用提供新的机会,更好地帮助客户。

BloombergGPT的研究论文已在arXiv上公开,详细内容可见下面的链接:

BloombergGPT: A Large Language Model for Finance

2. 阿里:下半年将发布和GPT-2.5同水平的大模型

4月1日,阿里举行了一次AI专家交流会,就阿里AI的研发进展进行了交流。

据了解,阿里正在研发一种大规模语言模型,预计可以达到GPT-3.5水平。该模型的数据集和技术架构仍在不断迭代和优化中。阿里巴巴达摩院发布了一种自然语言理解的大模型M6和Plug,支持多模态AI模型,但是相比于GPT-3.5还有差距。达摩院约100人团队正在迭代和升级M6和Plug,以达到能与GPT-3.5对标的水平。预计今年下半年云栖大会上会发布M6的最新模型,可能达到GPT-2.5左右的水平。

本次座谈会也提及了百度的AI产品。百度在国内被认为是做得比较不错的一家AI公司,尤其在搜索领域积累了很多数据。但是,阿里的专家认为百度还有很大的提升空间,而阿里正在研发的大模型相对来说效果更好,可以与集团内部的产品结合,如天猫、淘宝和高德地图的搜索业务,为搜索引擎带来更新的商业模式。此外,阿里还可以输出自己的API,并向合作伙伴或渠道商收费,形成生态系统中的垄断。虽然目前已有一些厂商尝试将阿里的API集成到他们的产品中,但进展不如预期快。阿里的API可能会在特定领域上有所帮助,例如电商、搜索和推荐,并带来更好的商业模式。

3. 微软开源贾维斯JARVIS,人人都可以部署属于自己的AI助理

https://s2.loli.net/2023/04/07/iCsB7Zg1bOTGuhS.png

微软近日宣布,将其研发的人工智能助理系统贾维斯(JARVIS)开源,任何人都可以在自己的设备上部署和使用。贾维斯(JARVIS)是一个基于深度学习的多模态、多任务、多语言的智能系统,能够处理文本、图像、音频、视频等各种类型的数据,实现语音识别、文本生成、图像描述、视频合成、知识问答等多种功能。

贾维斯(JARVIS)的灵感来源于漫威电影《钢铁侠》中的同名人工智能助理,它可以帮助用户完成各种任务和挑战,提供实时情报和数据分析,帮助用户做出决策等等。

微软表示,开源贾维斯(JARVIS)的目的是为了推动人工智能的发展和应用,让更多的人享受到人工智能带来的便利和乐趣。微软还提供了一个网页版的贾维斯(JARVIS)演示,用户可以通过简单的语音或文本指令,体验贾维斯(JARVIS)的各种功能。例如,用户可以说“给我讲一个笑话”,“给我生成一首诗”,“给我描述这张图片”,“给我合成一段视频”等等。贾维斯(JARVIS)会根据用户的指令,调用相应的模型和数据,生成相应的结果,并以语音或文本的形式回复用户。

微软表示,贾维斯(JARVIS)目前支持英语、中文、法语、德语、日语等多种语言,未来还会增加更多语言和功能。微软还邀请了全球的开发者和爱好者,参与到贾维斯(JARVIS)的改进和优化中,共同打造一个更强大、更智能、更友好的人工智能助理系统。

4. Vicuna-13B:仅需GPU即可本地运行的大模型

这是一款由lmsys.org基于LLaMA开发的大模型,该模型是通过在LLaMA基础模型上使用用户在ShareGPT.com上分享的大约7万条对话数据进行微调而得到的。训练过程需要8个A100 GPU,每个有80GB的内存。

有趣的是这个模型的性能是利用OpenAI最新的GPT-4模型作为评判标准来评估的。也就是用AI来训练评估AI。Vicuna-13B模型在初步评估中显示出超过90%的ChatGPT和Bard的质量,同时在90%以上的情况下优于其他模型。

目前,lmsys提供了一个演示网址:链接 感兴趣的朋友可以自行体验。如果您想自行部署,也可以查看官方的GitHub项目:

GitHub - lm-sys/FastChat: The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"


随想:社交媒体、ChatGPT 和心理健康

混乱中有机会,也有危险。我们必须抓住机会,排除危险。

After Babel 中,社会心理学家 Jon Haidt 最近花了很多章节讨论社交媒体和青少年心理健康之间的关系。他认为社交媒体,从 2010 年起深度影响了欧美国家青少年儿童的心理健康:

  • 焦虑和抑郁率的大幅上升;
  • 自残率和精神病住院率大幅上升;
  • 女性的患病率更高;
  • Z 世代(生于1995年至2010年之间的人群)的增幅大于老一代。

Hospital admissions for self-harm, younger teens (ages 10-14), CDC data.

Hospital admissions for self-harm, younger teens (ages 10-14), CDC data.

这种社会性的影响,是我们无法预见的。

看到这些讨论,很容易联想到 ChatGPT,以及最近那封充满争议的联名信。当下技术迭代的速度,已逐渐快过我们理解或思考的发展速度,伦理学、法律、政策早已跟不上了。

社交媒体造成的影响已是如此,那“黑箱”的人工智能呢?

《赛博朋克边缘行者》中的人物每被强化一次,身上的肉体就少一些。慢慢的,肉体和精神逐渐跟不上科技附加在他们深深的变化,最后是永久的癫狂。

任何在我出生时已经有的科技都是稀松平常的世界未来秩序的一部分,任何在我 15-35 岁之间诞生的科技都是将会改变世界的革命性产物,任何在我 35 岁之后诞生的科技都是违反自然规律要遭天谴的!

Douglas Adams

任何在我出生时已经有的技术都是我不得不接受的,是社会文化属性的一部分,我们也很难感知自己付出了什么。它们是我的优势也是我的劣势,需要花时间熟悉和感知这一切。

15-35 岁之间的我们,正值壮年。任何能为我带来优势和便利的技术,都是我所渴望的,两眼冒光的使用着他们。

35 岁之后的我们,已经习惯了一套工作和思考的模式,大多感受到自己的上限在何处。开始明白,一切都有其代价,只是很多时候我们没意识到到自己交换了什么。任何新鲜事物的诞生,都意味着我的“地位”可能收到冲击,而代价很可能就是我。

我并非恐惧人工智能,很多东西也由不得我们选择。仅是想思考,在这样的变革中,我们会交换什么?

科技的进步虽然为我们带来了很多便利,但同时也会带来许多不可预知的后果。我们需要思考和规划,以便更好地应对未来的挑战。


工具推荐

1. ChatGPT-Next-Web:在Vercel一键部署ChatGPT 网页服务

项目链接:https://github.com/Yidadaa/ChatGPT-Next-Web

主要功能:

  • 在 1 分钟内使用 Vercel 免费一键部署
  • 精心设计的 UI,响应式设计,支持深色模式,支持 PWA
  • 极快的首屏加载速度(~100kb)
  • 海量的内置 prompt 列表,来自中文和英文
  • 自动压缩上下文聊天记录,在节省 Token 的同时支持超长对话
  • 一键导出聊天记录,完整的 Markdown 支持
  • 拥有自己的域名?好上加好,绑定后即可在任何地方无障碍快速访问

2. ChatDoc:与 Word 文档进行对话的工具

官网地址:https://chatdoc.com/

免费版本可以在 24 小时内做到以下功能:

  • 最多上传 5 份文件
  • 每份文件不超过200页
  • 在同一个 24 小时窗口内,最多可以提出300个问题