article_image

近期科技新闻

1. 微软发布Copilot

https://s2.loli.net/2023/03/22/oeCiDJlZLI8jw3H.png

北京时间3月17日,微软宣布推出Microsoft 365 Copilot(注:Microsoft Office已更名为Microsoft 365)。这款产品将会把大型语言模型的技术融入Office办公套件中作为下一代办公产品,在Word、Excel、PowerPoint、Outlook、Teams等产品中均有应用。

据了解,该产品基于GPT-4,可仅依靠用户的文字描述生成对应的Word、Excel、PPT等。

目前,该产品尚未正式上线,还在限额内测当中。我们会持续关注该产品的后续进展。

2. 阿里巴巴达摩院发布文本转视频AI模型

项目地址:链接

本周阿里巴巴达摩院在ModelScope上开源了文本转视频的通用AI,该AI基于多阶段文本到视频生成扩散模型,目前仅支持英文输入并输出相应的视频。

图为官方示例中使用“A panda bear driving a car.”的prompt生成的视频。

https://s2.loli.net/2023/03/22/bFlC6QSG5oOhRWe.gif

该模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

3. 李彦宏:市场对文心一言的反应符合预期

根据财经网3月18日报道,2023亚布力中国企业家论坛年会现场,百度创始人、董事长兼首席执行官李彦宏在接受采访时回应了外界对文心一言发布后的市场看法。李彦宏表示,“外界反馈基本与预期相符,一直在关注文心一言发布后的市场和内测反馈。”

https://s2.loli.net/2023/03/22/ko4L8YPCXcKQaE1.png

值得注意的是,虽然在文心一言发布会当天百度在港交所(9888.HK)的股价一度达到了接近10%的跌幅,但在后续的四天内迅速反弹,涨幅达到了约20%。可以间接看出市场对该产品的改观很大。

4. Google Bard开放公测申请

申请地址:链接

Google于北京时间3月21日正式开放Google Bard的公测申请。目前该产品仅支持美国和英国的IP进行申请。截至本篇文章写稿时间,已经有一批用户收到了使用资格。Steven也已经在第一时间收到了公测资格。

经过Steven的上手体验,Bard目前尚未支持英文以外的语言。但相比GPT而言,Bard具有响应速度快、支持联网等优点。但该产品相较于GPT-4而言在事实准确性等方面有明显不足。

https://s2.loli.net/2023/03/22/Sf8lNT5nDRJhUcY.png

有关该产品的详细评测我们已推送,详情请看https://aipulse.one/google-bard/

5. Adobe开放Adobe Firefly公测申请

申请地址:链接

https://s2.loli.net/2023/03/23/C4dumcPwvftbx8e.png

北京时间3月22日,Adobe也宣布加入AI绘图的军备竞赛中,开放了Adobe Firefly的公测申请。

然而在Reddit上出现了不少反对的声音,许多人质疑Adobe并反对其垄断行为。

6. 微软发布绘图AI:Bing Image Creator

体验地址:链接

微软于北京时间3月21日宣布图像领域的新产品Bing Image Creator。

与Bing Chat不同的是,Bing Image Creator不需要申请测试资格,也没有限制国内地区的使用,因此点开链接是可以直接使用的。

据了解,这款产品是基于OpenAI的图像AI DALL-E的最新模型,但OpenAI并未公布该模型的具体版本。微软也会在未来将该功能加入Edge的边栏中。

在我们的实际体验中,Bing Image Creator生成速度较快,一次性会生成四张备选图片。但会有次数限制,超过使用次数限制之后,您仍然可以继续生成图片,但生成速度会大大降低。除此之外,相比于同类产品Midjourney,Bing Image Creator在图像的审查方面更加严格。

https://s2.loli.net/2023/03/22/m6LYeaw3qvGFrl4.png

我们会持续关注该产品,并在后期进行更详细的评测。


AI工具推荐

1. Edge GPT——由逆向工程打造的Bing API

GitHub: 链接

https://s2.loli.net/2023/03/22/5DPFUNVTHX8J3iq.png

这是由acheong08通过逆向工程开发的Bing Chat API。目前该项目除了支持了Bing Chat之外,还增加了对Bing Image Creator的支持。

2. Cursor——基于GPT-4的编程利器

官网:链接

https://s2.loli.net/2023/03/22/4fEhQVZ7Ip1zSDu.gif

Cursor是一款基于GPT-4的代码编辑器,支持Python, Java, C#, JavaScript等多种编程语言,可以帮助用户重构、理解和优化代码,提高开发效率,也大大降低了开发的门槛。这款工具无需登录和多余配置,国内可以直接使用。

目前这款工具支持Windows、Linux、MacOS三个平台。

3. PandaGPT——一款基于GPT的PDF提问工具

https://s2.loli.net/2023/03/22/QpOf8d1YANglT4s.png

这款工具是基于ChatGPT的提问工具,支持将PDF文件上传并对原文内容进行提问。与我们前一期介绍的ChatPDF不同的是,这款工具支持PDF预览,生成的答案中会生成对应的页码链接,点击可以直接跳转到文章的相应位置。

值得注意的是,这款产品目前仅支持免费的10次提问。一些细节上也不如ChatPDF成熟。相比之下,ChatPDF是更简单更受欢迎的选择。

4. GPTCommit——解决不会写commit message的难题

项目地址:链接

该项目基于GPT-3,目的是通过直接生成更准确的commit message,让人们更加专注于代码本身,提高效率。

5. Samantha——基于LLM和TTS的语音机器人

Bot链接:Telegram

这个语音机器人由Shell开发,根据官网介绍,这是第一款将语音、Web3、AI整合的机器人。目的是通过将个性、语音特征等存入Shell NFT中,让每个人打造属于自己的机器人。

https://s2.loli.net/2023/03/22/Ji1UGknf4EORVgz.png

目前由于服务器负载原因,该机器人仅支持每日100次免费对话。

Steven认为,这或许是个不错的练习英语口语的方式。


如果您对于周报有任何意见和想法;如果你有自己使用AI工具的心得/自己对于AI的看法等,也欢迎给我们投稿。

联系人:Steven 联系邮箱:steven@aipulse.one