关于 ChatGPT 等生成式AI的一些思考
特意选了个 BA 的图,来凸显机器人(
0x00 引子
2024 年转瞬即逝,甚至比以往更快。本科时候觉得每一天都很漫长,而现在一周的时间就已经过得飞快,这可能就是老人们常说的,年龄越大,时间越快吧。
回顾 2024 年,也就做了一件事情:从硕士变成了博士。虽然顶着白天干活,晚上开会的极致牛马生活,但是找到了自己并不讨厌的事情,也何尝不是一种幸福呢?虽然说毕业还是遥遥无期,但是能做好目前的每一件事情,已经让我足以知足常乐了。
生活上,年中大病了一场,推测是低颅压。感谢那段时间家人、师门和朋友的帮助及照顾。最后确定的原因是过度出汗及摄入盐分不够,因此以后会多多考虑摄入盐分。年底决定痛定思痛,开始锻炼减肥,经过两个月的半拷打,终于在新年达到了 99.7 kg (然后第二天就反弹到 102.5 kg,乐)。
年初买了个 A7C2 搭配腾龙的 28 - 75 mm 二代,开始了最昂贵的艺术学习之路(接近 2w)。总共拍了上千张的照片,也可以说从完全不会拍到稍有入门了。尤其在后期方面,感谢索尼得天独厚的性冷淡色彩,我在后期方面有了一些进步,至少可以出现偶遇索尼逆天曝光,拼尽全力无法战胜这种现象。而我的阅读列表中也逐步加入了摄影基础入门教材,以充实我那并不充沛的脑壳。然而这个爱好真的太烧钱了,争取今年再买一枚适马 70 - 200 mm F2.8。
但是令人齿冷的是,今年的博客基本没有再更新了(从今年的年度总结退化成引子就能看出来),每个月 5 美刀的 Linode 服务器,根本没有用上。思来想去其实不外乎两点:1. 有很多事情我认为都可以用 ChatGPT 自行解决,实际上很多重要进展如家用服务器的部署及改进都是通过 GPT 完成的,而在代码编写上,也主要以 GPT 为主。更何况,我现在可以直接使用 GPT 生成一篇博客;2. 学业压力也罢,表达能力局限也好,说到底其实还是个人不够勤奋。由于学习的知识不足以分享,因此也没有办法写出一篇像样的博客。
但是经过了近两年的 ChatGPT Plus 的使用和 Claude 3.5 的试用,以及一些其他的应用,我认为可以总结一下使用的心路历程和经验在这里分享了。本文主要是以普通用户的角度去讨论,因此不会对隐私、安全或者版权等内容夸夸其谈。同时我也非常不希望 AI 抓取我的文字垃圾,求放过。
0x01 用过的 GPT 们和日常应用场景
这几年其实使用的最多的还是 ChatGPT Plus
,20 $ 一个月,从 3.5 到 4,再到 o1,共计两年。注册流程略麻烦,需要国际手机注册(据说已经取消限制),且保活困难,容易被封号,但本人使用的国外信用卡,有明确的真实地址,因此没有被查封过。日常限额上,师门五六个人使用基本不会超出限额,o1 除外,由于限额太低,时常会触碰使用限制,但其他的足以应付日常需要。功能主要可以编写代码、语音识别、在线搜索、简单的文件处理和项目管理,但偶尔会抽风,推测是网络问题。期间也在 Claude
充值了一个月的会员,也是 $20 一个月,发现和 ChatGPT
相比, Claude
丢失了在线搜索的这一个较为关键的功能,因此在处理较新的知识或者搜索上,会出现很麻烦的问题,而在代码编写上,二者各有侧重。但基本都可以完成代码编写。Gemini
的 安卓客户端最为友好,对于 HyperOS 设备兼容最好(感谢谷歌),且 API 量大管饱,因此也做临时使用。但在使用时发现明显不如前二者处理问题能力强,仅能胜任一般较为简单任务,且对上下文理解明显存在问题。此外,本人也使用 Microsoft Copilot
和 Github Copilot
这种应用性,其中,Github Copilot
由于可以直接集成到 IDE 并且是代码特化,因此在编写代码上可以替代绝大多数黑奴活动。
不得不说的是,生成式 AI 确实极大地解放了生产力。对于以往来说,写一个代码需要查阅相关文档、自行组织架构、手写每一块,并进行测试。而在 AI 的帮助下,我只需要分析需求、给出指令、进行测试就可以完成绝大多数数据处理及可视化任务。此外,AI 也可以完成较为简单的答疑或入门,对于一般简单概念解释不会存在太大问题,本人对于服务器搭建及运维也均通过 AI 辅助完成。而部分 AI 具有在线搜索能力,获取网页简要信息并进行总结也是他的优势之一,这点在总结页面信息时显得至关重要。而在科研中其最大的优势就是在于翻译,其翻译质量不逊色于 DeepL,尤其在于专业论文翻译的连贯性和一致性。此外,在文字生成及润色处理上也体现出极高的成熟度,基本可以做到开箱即用。用个最离谱的案例,本站的较新文章都会通过 GPT 进行初步审改。
0x02 天下没有免费的午餐
一切看似都那么美好,但是这是真的吗? 在周志华的《机器学习》中,我们就学到了一个重要理论:NFL (No Free Lunch)
,也即,天下没有免费的午餐,你在享受一定的便捷的同时,也必须承担另一部分责任。
首先,AI 生成的信息,必须经过二次考据。具体可举例为:编写的代码很难第一次就符合预期,必须通过自己的测试及修改才能达到自己想要的结果;论文参考文献查询时经常擅自编造合理度极高的文献来源,甚至有完整的 DOI 编号,但在文献库中并没有;语料生成的内容也多半为杂糅的结果,所以对于事实等内容,仍需要进一步考察,最好结合自身专业知识及经验进行合理取用。
其次,创新性工作不可依赖 GPT。由于语料均为已有成果,因此在已有知识较少或需要创新性、前瞻性的工作中,GPT 很容易受限于语料而进行外推,从而得到看似合理实则狗屁不通的内容。对于一些稍复杂的概念,GPT 的理解可能会出现问题,不一定能准确表述内在逻辑,更有甚者,会回避主要矛盾。此外,诸如 Stable Diffusion 生成的 AI 怪图也可见一斑,所以在创新性上暂时还是以人类为主导。
此外,AI 生成的内容使用需要进一步小心。在师门使用时就出现了将 AI 图片作为原理示意图使用的案例,这明显是错误的。且受限于语料,明显对于特定专业软件如 ArcGIS 的 ArcPy API 的理解不足,难以完整地写出可运行的代码,需要结合文档进行理解,并利用 GPT 辅助方可获得想要的代码。
0x03 总结及展望
虽然 GPT 在师门中的应用极为广泛,但本人对于 GPT 所能达到的效果持保留意见。GPT 无疑在代码编写、简单运维、翻译、不查重的文章撰写中具有明显优势,可以极大解放这部分的劳动;但其生成的信息不一定准确(免责声明甚至不止一次提醒过),需要结合专业基础知识进行二次确认。且过度使用 GPT 无疑会造就思维上的懒惰性,进而丧失进一步学习的机会。因此,GPT 应被合理使用以解放生产力及提升自身,而不是成为其附庸。
0x04 Too Long to Read
- GPT 确实给科研、工作、生活上带来便利,甚至超出你的期待
- 应用 GPT 时需要二次核对信息,生成的信息需要谨慎使用
- 打铁还需自身硬,GPT 只能起到辅助作用,具体落实还是自己的事情
- 免费的 Gemini API 还有学生可用的 Github Copliot 应用尽用