article_image

【本周 AI 消息】为 Untag 试验性栏目,内容来自会员 @BoranCui 的投稿。

微软发布了Visual ChatGPT,Google发布了PaLM,并将AI技术应用到Gmail和Docs中,百度发布了基于文心大模型技术推出的生成式对话产品“文心一言”。同时,还介绍了一些AI工具,如AMA客户端、MSD AI、Dall·E模型等。总的来说,本期周报介绍了众多的新技术和工具,对AI领域的发展起到了积极的推动作用。

近期科技新闻

1. 基于ChatGPT和可视化模型的ChatGPT——Visual ChatGPT

微软于近期在GitHub发布了Visual ChatGPT,Visual ChatGPT连接了ChatGPT和一系列视觉基础模型,使得在聊天过程中可以发送和接收图片。

在实际体验过程中,发现Visual ChatGPT在图片识别方面较强,但生成图片的能力还有待提高。

另外,在我们的实际演示中,发现Visual ChatGPT显存要求太高,在12G显存的情况下,只能开三个模型,因此效果不是很好,不知道在模型多一些的情况下,图片生成质量会不会有改进。

GitHub项目:地址

Hugging Face官方演示: 地址

2. OpenAI正式推出GPT-4

OpenAI于3月15日凌晨2点正式推出GPT-4,相比之前GPT-3.5在逻辑能力、语言能力、事实准确性方面有了明显的进步。GPT-4支持多态输入,包括图片和文本,能够从图像中提取文字并理解。基于GPT-4的ChatGPT更加人性化,更加安全可靠,有更高的道德感,语言能力更丰富。未来预计会有大量基于GPT-4的产品问世。

https://s2.loli.net/2023/03/15/iLJDdcUV9ZwE8ju.png

目前仅支持开发团队申请Waitlist以及ChatGPT Plus用户使用。定价方面,GPT-4的API价格为每 1k 个 prompt token 0.03 美元,每 1k 个 completion token 0.06 美元。默认速率限制为每分钟 40k 个 token 和每分钟 200 个请求。 GPT-4 的上下文长度为 8,192 个 token。相比GPT-3.5 Turbo的速度慢很多。

3. Google发布PaLM

Google博客原文:链接

https://s2.loli.net/2023/03/15/R3TWltEzpPvOBjx.png

Google在OpenAI发布GPT-4的同一天发布了PaLM的API。不过似乎由于大家对GPT-4的期待更高导致这个话题关注度很少。

PaLM可以生成和编辑文本和代码等任务。这天还发布了一个叫 MakerSuite 的工具,帮助开发人员更好地使用这些技术。谷歌还宣布将在 Gmail、Docs等应用中提供更多的AI功能,例如优化人们的电子邮件和帮助创建幻灯片。

谷歌宣布要把AI技术应用到Gmail和Docs中,让人们工作更高效。只要输入主题,AI就会帮我们生成文章或邮件。可惜现在PaLM还没对大众开放,只能给一些测试人员试用。微软也在3月16日展示了类似的技术,将AI融入日常工作环境中。

4. 百度发布AI产品文心一言

3月16日下午,百度创始人、董事长、CEO李彦宏宣布“文心一言”正式发布。这是百度基于文心大模型技术推出的生成式对话产品,对标ChatGPT。

“文心一言”又名ERNIE Bot,是百度方面基于文心大模型推出的类ChatGPT产品。文心大模型具备跨模态、跨语言的深度语义理解与生成能力,预计其在搜索问答、内容创作生成、智能办公等众多领域将有应用场景。

Untitled

发布会结束之后,百度仅开放了邀请通道,但我们尚不清楚邀请资格的获取方式。因此我们无法直接判断该产品是否达到预期。

值得注意的是,在发布会期间的一小时内,百度在港交所(09888.HK)的股价跌幅达到了约8.7%。从市场反应来看,这款产品远远未达到大众预期。

5. 使用AI图像技术的商业广告

可口可乐最新广告使用了 Stable Diffusion AI

3月6日,可口可乐在自己的最新广告视频中使用了Stable Diffusion,配合3D技术,进行广告拍摄。利用这个技术,产生了许多让人意想不到的艺术效果。

广告视频:链接

麦当劳广告中使用NeRF创作

实际上这已经不是第一次将AI图像技术用于商业了。早在今年1月18日,麦当劳就与 @LumaLabsAI 合作,利用NeRF来协助构建一些3D图像。

链接1链接2


近期 AI 工具推荐

1. AMA 客户端——支持代理服务的 ChatGPT 客户端

这是一款非常漂亮的 ChatGPT 客户端,支持使用代理服务(API Server),并且作者提供了一个中转服务器,因此在大陆地区也能支持直连。同时也支持使用自己的中转服务器。

Untitled

此外,这款客户端还拥有非常漂亮的 UI,遗憾的是目前仅支持在 iOS 上使用。

链接:TestFlight

2. MSD AI ——一款基于默沙东诊疗手册的问诊 AI

由 GanymedeNil 制作的,基于默沙东诊疗手册的问诊 AI,程序已开源,让 Turbo 模型进行学习。

《默沙东诊疗手册》,是一本医学教科书,属于《默克手册》的一部分,该手册由制药公司默沙东在美国和加拿大的子公司默克出版公司发行。默沙东诊疗手册是世界上最畅销的医学教科书,也是最古老的英语医学教科书。

Untitled

这个 MSD AI 基于作者开发的“基于向量数据库与 GPT 3.5 的通用本地知识库方案”,已经在 GitHub 上开源,可以应用于各种冗长的服务手册说明书等文档,很值得关注。

链接:Twitter

3. Dall·E模型——OpenAI开发的AI绘画工具

Dall·E模型可以使用自然语言来生成画作,也支持上传图片后让AI编辑图片,效果非常不错,整体编辑的很自然。生成的画作质量也比较高。

除了生成画作,Dall·E模型还支持生成模拟真实世界的“模拟图片”。

Untitled

第一次使用Dall·E时会赠送50代币,仅限在第一个月使用,之后每一个月都会赠送15代币。如果使用完代币还可以通过充值来获取代币。

Dall·E 模型:地址

4. OpenGPT——生成 ChatGPT 工具的工具

@倪爽开发的一款能够”生成 ChatGPT 工具的工具“,创建的方法很简单,设置图标、取名、添加描述、设置 prompt、举例说明用法。

Untitled

现在可以匿名创建一个应用,网站下方也有很多其他人已经创建好的不错的ChatGPT应用。

创建应用:地址

5. 自然语言查询转换为 SQL 代码——Human to SQL Translator

这个AI工具完全免费且开源,可以将自然语言查询转换为 SQL 代码,让用户轻松地完成这项任务,可以帮助你更高效地完成数据分析和管理工作。

Untitled

这款软件也支持中文,效果还不错,如果需要经常与数据库打交道的可以尝试使用。

使用地址:链接

6. ChatYouTube

Untitled

这是一款基于ChatGPT的在线工具,它可以让你与任何YouTube视频对话。它可以帮你快速解读总结YouTube长视频内容,让你不用花费太多时间就能了解视频的主要信息和观点。

使用方法很简单,只需要粘贴YouTube视频链接到该工具中,然后等待几秒钟,AI就会观看学习完整个视频,并生成一个对话界面。在对话界面中,你可以向AI提问关于视频中的任何内容,比如视频的主题、作者、观点、细节、亮点等。AI会根据视频内容给出回答,并引用相关的时间戳和字幕。

除此之外,我们上期介绍的哔哔终结者也有支持YouTube。

ChatYouTube地址:链接

7. Poe

Peo是一个提供多种AI chatbot的在线平台,目前提供的chatbot包括ChatGPT(GPT-3.5-turbo和GPT-4),Claude和Claude+以及Sage和Dragonfly。在免费套餐下,GPT-4和Claude+仅有1次的提问机会,超过了限制次数会进入12小时倒计时,结束后才能继续使用。目前付费的价格为$199.99/年。

Poe内置了一些常用的对话模板,可以很方便地使用对应的功能。

558FBDDC-E923-485C-969B-F950E5061DB9.png

目前Poe仅支持网页端以及iOS/Mac端,并且付费也仅支持在App Store中付费。

小结

在ChatGPT的API发布后,各种各样的AI工具都在第一时间推出。随着第一周的AI工具“热潮”渐渐褪去,软件渐渐变少,但现在推出的工具质量都更加优秀、也更有使用的意义,更加值得一试。


如果您对于周报有任何意见和想法;如果你有自己使用AI工具的心得/自己对于AI的看法等,也欢迎给我们投稿。

联系人:Steven 联系邮箱:steven@aipulse.one