所谓“全球首个 AI 程序员”被曝演示造假,呼吁警惕 AI 炒作
近期,一位名为 Devin 的 AI 软件工程师在科技界引起了广泛关注。这家名为 Cognition AI 的初创公司宣称:“Devin 是世界上第一位完全自主的 AI 软件工程师,能够独立完成编程任务”。然而,经过 YouTube 博主 “Internet of Bugs” 的深入分析和尝试复现 Devin 的演示后,发现其表现并不如宣传所言。Devin 在 Upwork(美国的一个自由职业平台)上的任务处理能力也受到了质疑,博主指出,Devin 并未按照客户的具体要求提供详细的操作指南,而是仅仅完成了一些基本的代码更改。
博主在视频中提到,Devin 在处理一个任务时,花费了 35 分钟 55 秒,而他自己仅用 36 分钟就完成了相同的任务。这一对比突显了 AI 在效率上并非总是胜出。此外,博主还发现 Devin 在处理任务时会生成错误代码,然后又自己修复了,这不是常规做法,而且与宣传中描述的能力大相径庭。这一发现引发了对 AI 技术实际应用能力的深思,也对 AI 炒作现象提出了批评。
视频全长 25 分钟,博主提到了很多具体的分析来佐证他的观点,还对开发工作和 AI 都提出了一些独到的想法,感兴趣可以观看原视频。我节选了其中的几段发言:
我已在软件行业工作了35年。我并不反对 AI,但我坚决反对对其进行过度炒作。
我需要强调的是,我个人认为生成型 AI 非常酷。我定期使用 GitHub Copilot,也使用过 ChatGPT、Llama 2 和 Stable Diffusion。这些工具都非常棒。但是,夸大其词,对这些工具的功能进行过度宣传,对所有人都是不公平的。 因此,尽管 Devin 做了一些令人赞叹的事情,我希望他们能保持真实,简单地承认这一成就。但他们并没有这么做,他们不得不假装其功能远超实际情况。
作为一名软件工程师,我认为软件开发人员的工作中最难的部分、最关键的部分、最复杂的部分、最耗时的部分,主要是与客户、上司和其他利益相关者的交流。我们需要弄清楚实际需要处理什么,反复讨论「如果这样做会更简单,我们是否可以这样做?」这些都是 AI 目前无法完成的任务,而这些恰恰是我们工作中最重要的部分。
目前,对 AI 的盲目信任已经使许多人陷入困境,其中 AI 律师伪造案件和 AI 伪造科学论文都是一些明显的例子。
Devin 的案例提醒我们,在 AI 技术的发展过程中,我们需要保持清醒的头脑,对 AI 的宣传和应用持有合理的期待。同时,这也呼吁科技界和媒体在报道 AI 进展时,应更加注重事实的核实和真实性的传递。
看到这些信号,意味着你应当放弃阅读一本书
在阅读的旅途中,我们有时会遇到那些难以引起共鸣的书籍。《纽约客》的一篇文章以轻松幽默的笔触,揭示了那些暗示我们可能该放下书本的时刻。
文章中提到,如果你发现自己在阅读时,竟然希望书中能插入一个谋杀案来活跃气氛,或者在阅读20分钟后才意识到自己已经打起了瞌睡,这些都是你与这本书缘分已尽的信号。
特别是对于那些评价为“激动人心”的书籍,如果这些评价仅仅来自平时喜欢打羽毛球的读者,那么或许你也应该重新考虑是否继续投入时间和精力。
再比如,如果你计划坚持读完前 100 页,却发现自己阅读的速度慢到一年只能读一页,这无疑是一个明确的信号,告诉你这本书可能并不适合你。
文章以其独特的风格,让我们以一种轻松的方式重新审视与书籍的关系。它提醒我们,阅读应当是一种享受,而不是一种负担。当我们在阅读中寻找乐趣而非压力时,我们才能真正领略到书籍的魅力。
“如果你更期待Gary Oldman主演的电影改编版而不是阅读原著,这表明你可能更喜欢视觉而非文字的叙述。” —— JiJi Lee
苹果在欧盟的新变化:开放侧载等于完全放开 App Store 吗?
编者按:这是一篇把 Sideload 讲的比较清楚的文章。
苹果最近在欧盟搞了个大动作,为了迎合《数字市场法案》的要求,他们对 iPhone 上的应用分发策略来了个彻底的翻新。这意味着,除了苹果自家的 App Store,第三方应用市场和侧加载也将成为可能。例如 Setapp 这样的服务已经摩拳擦掌,准备把服务带到 iPhone 上。这一改变不仅给软件开发者们带来了前所未有的机遇,连微软、Adobe 这样的巨头都可能要来分一杯羹。
说到这次变化,最让人眼前一亮的莫过于苹果对侧加载的开放。Setapp 的高管 Mykola Savin 对此表示,这对软件开发者来说简直是个福音,能开辟出全新的获利途径。现在,开发者们甚至可以自己建个市场,只卖自己的应用,这对于想摆脱苹果高额分成的他们来说,简直是个大利好。
不过,新规则也不是全无挑战。比如说,一旦应用下载量超过百万,开发者就得向苹果支付每下载 0.5 美元的核心技术支持费(CTF),这对于依赖免费用户基础的增值服务来说,压力仍然很大。Savin 认为这一点可能会让一些商业模式受挫,但他觉得这还是必要的,至少能保证应用市场的水准。不过,他也担心,对于那些用户多、付费少的应用,这个费用可能会成为不小的负担。
尽管有些挑战,但新规带来的好处还是显而易见的。像 Setapp 这样的市场,可能会给我们带来更多精挑细选的好应用,价格也更透明。开发者们也能省下一大笔拉新成本,直接接触到更多用户。Savin 说苹果正在努力让这个过程对开发者更友好,但他也提到,苹果的新商业模式还有不少地方需要明确,特别是分成模式这块。
Setapp 计划今年晚些时候就会在 iPhone 上推出,先是封闭测试,然后是公开发布。用户可以直接在市场里下载应用,体验和 macOS 上差不多。不过,他们也表示,对于欧盟以外的用户,或者那些跨平台的应用,体验可能就没那么完美了。
“如果苹果在欧盟的这些变化能够成功,他们可能会考虑把这些变化带到更多地方,只要这样做不会影响到他们的收入和核心业务。” —— Mykola Savin, MacPaw 产品管理总监
轻松整理文件:使用 PowerShell 和 Excel 自动批量复制文件
如何高效地管理和归档文件一直是让众多职场人士头疼的问题。本文介绍了一种创新的方法,通过结合 PowerShell 脚本和 Excel,实现了文件自动归档的自动化。只需预先在 Excel 中设置好归档规则,脚本便能智能识别并执行文件的复制与分类,大大提升了文件管理的效率。
文章中详细展示了脚本的运作流程:首先定义源文件夹和目标文件夹的路径,再导入 Excel 中的数据,通过循环和条件判断,自动创建目标文件夹并将文件一一归位。
值得一提的是,脚本能够智能识别并跳过已复制过的文件,避免了重复劳动,确保了文件归档的准确性。这一过程不仅节省了大量的手动操作时间,也减少了人为失误的可能性。
开源 Redis 的生命将就此终结?Redis 之父回应分叉浪潮:未来谁能领先,各凭本事!
Redis,这个曾经坚守开源 BSD 许可证的内存数据存储方案,如今却宣布转投 SSPL 许可证的怀抱,这一决策无疑在开源社区掀起了波澜。文章指出,Redis 的这一转变直接影响了其下游开发人员,甚至导致一些核心贡献者选择离开。特别是 Redis 在 Docker Hub 上的下载量已超过 10 亿次,其在全球项目和基础设施中的深度嵌入使得这次许可证变更的影响深远。
Redis 之父 Salvatore Sanfilippo(Antirez)对于此次变更表现出了理解的态度,他认为开源项目的分叉是 BSD 许可证下的常态,任何人都可以在其基础上进行创新。Antirez 在 Reddit 上的评论显示,他将 Redis 项目的未来发展交给了市场和社区的选择,认为最终能够提供卓越技术和适合许可证的项目将成为赢家。
“SSPL 可以保护项目免受亚马逊等大型公司的侵害,也可以保护其他公司和开发者,防止他们的工作被利用而无法获得收益。这是一种工具,我个人认为它是合理的,但具体是否使用还需要根据具体情况来决定。” —— Salvatore Sanfilippo
Redis 的分叉项目如雨后春笋般涌现,其中不乏由亚马逊云科技工程师 Madelyn Olson 等人发起的新分叉,以及 Drew DeVault 创建的 Redict 项目。这些项目的出现,预示着开源社区对于 Redis 未来发展的不确定性和期待。Redis 的开源之路,似乎正在迎来一个新的起点,而这个起点将由社区的每一个成员共同决定。
80 年代的苹果概念机,通过模块化组件进行扩展
在 1980 年代中期,苹果公司面临着关于其计算机平台未来的多个选择。Apple II 是公司的主力产品,而 Apple III 则被视为该平台的进化,但由于硬件和软件问题,其前景并不乐观。Lisa 计算机虽然技术先进但价格昂贵且销量不佳,而 Macintosh 虽然旨在将 Lisa 的技术带给大众,但在最初发布后的销售也相对缓慢。
除了这四款知名的计算机外,还有第五种可能性,即 Jonathan 概念机。
这是一款面向消费者的模型计算机,预装了操作系统和基础级 I/O,可以在购买期间或之后升级到面向业务的规格,使用一套独特的即插即用模块。客户可以添加一系列书籍大小的模块(用于软件和硬件选项),这些模块点击到一个细长的底座上,该底座位于显示器下方,本身看起来像一个书架。在原型中,单独的软件模块包含了 Apple II、Mac、UNIX 或 DOS 的操作系统,而硬件选项包括 DSP、以太网、GenLock(用于视频)、额外的 RAM、大规模存储或不同地区的电源供应。没有电缆。
Jonathan 是一个更为超前的概念产品,由苹果工程师 Jonathan Fitch 在 1984 年提出。这款计算机的设计采用了模块化的思路,用户可以根据需要添加或更换硬件和软件模块,从而实现个性化的计算机配置。Jonathan 的设计在当时看来极具创新,但由于技术和市场风险,最终未能实现量产。值得一提的是,Jonathan 的设计中包含了一个独特的背板系统,可以支持多种操作系统,包括 Mac OS、Apple II 软件、DOS、Windows 或 Unix,这种设计理念在当时无疑是领先于时代的。
原文提到,互联网上关于这个东西的图片非常少,照片来自 Nicola d'agostino 的博客文章,原文链接中还有更多相关的图片资料。
尽管 Lisa 和 Jonathan 未能在市场上取得成功,但它们在计算机发展史上的地位不容忽视。它们不仅展示了苹果公司在技术创新上的大胆尝试,也为后来的产品设计提供了宝贵的经验。如今,当我们回望这段历史,不难发现,正是这些曾经的尝试和失败,铸就了苹果今日的成功。
Github 上的有趣项目:用 Excel 实现的 CPU
在Excel表格里模拟一个16位的CPU,听起来是不是有点疯狂?但这正是InkboxSoftware团队带来的创意项目——Excel 16-Bit CPU。这个项目让编程爱好者和计算机科学初学者在熟悉的Excel环境中,体验到CPU的运行和编程的乐趣。它配备了16个通用寄存器、128KB的RAM和一个128x128的显示屏,通过Excel的计算能力,模拟出计算机的核心运作。
这个模拟器的亮点在于它的互动性和易用性。用户可以通过简单的Excel操作,比如设置时钟信号、控制重置按钮、读取或写入ROM等,来直观地学习CPU的工作原理。而且,它支持24种汇编指令,涵盖了从基本的加减乘除到复杂的位运算,为学习者提供了一个全面的学习平台。这种将复杂计算机原理与日常办公软件结合的方式,无疑降低了学习门槛,增加了学习的趣味性。