如各位朋友所见,网站的底栏新增了一个图标:Not By AI。我觉得还是有必要解释一下。

首先是长话短说版本:

长话短说(TL; DR)

  1. 本站至少 90% 的内容由人类创作。(Not By AI 90% 声明)
  2. 我不反对生成式 AI 的使用,相反,我是生成式 AI 的积极使用者之一。
  3. 在我的个人创作领域,我对生成式 AI 文本的使用有自己的规则。

    1. 我不使用生成式 AI 创作任何文章的主体部分;
    2. 我可能使用生成式 AI 就结构、文法、语病、用词等内容获取建议;
    3. 我可能使用生成式 AI 进行初步的文章灵感获取,或文本大纲的梳理工作;
    4. 可能存在违反以上内容的特例,对于此类特例,其将有明确的标注。
  4. 在我的个人创作领域,我不使用任何 AI 生成的图片为文章配图,除非文章本身的内容即为对其的探讨。

    1. 我认为,当且仅当生成式 AI 模型对它的训练集“拥有完全的版权”(copyright-clean)时,其使用才是合乎法律、伦理及当下共识的。
    2. 现阶段,我不信任任何 AI 模型训练者的版权声明。
  5. 以上内容只是对我个人的约束,我不同意以我的标准去评价任何其他人的行为。我本人会避免这么做,也请所有本站的读者朋友不要这么做。

下面是短话长说版本。

为什么要这么做?

说实话,其实没什么必要。可能只是我中二病犯了。

但是,无论你喜欢还是不喜欢,AI 生成的文章已经大行其道了。无论是微信公众号还是知乎,无论是小红书还是 B 站,有文字的地方就会出现 AI 生成的文字。

引用 Not By AI 的原文:

有专家估计在 2025 年,会有超过九成的线上内容为 AI 所生成 [1]。在这样的 AI 狂澜之下,我们必须提醒自己 AI 是以人类过去的创作所训练而成。换句话说,假如人类从此便全面仰赖 AI 来生成内容,这些新的内容恐怕只会是回收过重置的旧内容罢了。这对人类文明的进展恐将造成极大的威胁 [2]。唯有限制 AI 的使用并持续坚持原创内容才能确保人类的进步。

然而,必须强调的是,AI 科技是史上无可否认的重大里程碑,而我们设计 Not By AI 贴纸并不是不鼓励你使用 AI。我们是要确保人类能够与 AI 携手向前,而非被 AI 给取代。

AI 不断重复使用过去人类所创作的内容来生成“新”的内容(来源:notbyai.fyi)

[1]:Why 90% of online content could be 'generated by AI by 2025'

[2]:AI produces gibberish when trained on too much AI-generated data

当然,上面这段话还是有些耸人听闻的,至少我就很乐观:在可预见的未来内,AI 完全不可能替代人类。

但是,这并不代表上面的观点就失去了效力。迄今为止,人们其实还没有搞明白生成式大模型的丹到底是怎么炼出来的。虽然可能有的观点支持“涌现”论——也就是说,足够多的数据集能够使生成式 AI 涌现出人类历史上从未出现的内容,但我仍然认为这只不过是一种更高级的“杂糅”,是对现有的人类语料海洋的一种重组和再拼接。这里应当引用一些论文,但我实在不愿花时间去找文章了,所以就这样吧(

当然了,其实人类自己也没把自己思维的原理搞明白——人类的创作到底是怎么出现的?它是不是也只是一种对周遭世界的重组和再拼接?毕竟有句话是“人类不能想象自己没有见过的东西”。我当然不认为人类思维和生成式 AI 是相同的。我相信人类思维总有一些比生成式 AI 的原理更加深邃,更加富有活力的部分在。但当然,这可能也只是我的一厢情愿。再说下去就该到哲学范畴的讨论了,所以我们到此为止。

因此,我的观点更倾向于——如果人类停止创作,那么生成式 AI 自然也就无法再产生新的东西。正因如此,我们更加应该紧握住手中的笔杆子,更加坚持自己的创作,更加坚持由自己创作。我们不应当、也不能仅仅满足于 AI 所生成的内容。

哦我明白了,那你是反 AI 是吧

恰恰相反,我完全不是。我反而是生成式 AI 的积极使用者。

举这样一个例子:在本站有一系列和编程有关的教程,其中我要特别单拎一例出来:Django 实验平台开发的系列教程

熟悉我的朋友都知道,我的代码底子非常非常薄弱,我没有能力完全独立完成一项复杂的开发任务(我本来就不是学计算机的!)。因此,如果你看到了我写的代码,它们很大概率上是先用 AI 生成,再由我手动去调整、修改的。

但是,首先,能读懂这些代码并且修改这些代码也是需要基本功的;其次,虽然代码本身可能不是我亲手写上去的,但“需要什么”和“想要什么”是我自己决定的——换句话说,在开发这件事上,AI 和代码本身都是工具,工具就是用来解决问题的。

如果你有兴趣,我会推荐你阅读这篇文章:我见到了 Rune 的开发者并和他畅谈了六个小时。Rune 是一款本地音乐播放器,它的开发者 RORIRI 是一位 ADHD 患者——这意味着他很难完成复杂的开发任务。大语言模型的出现让他看到了一种不同的路线,他在大语言模型的帮助下完成了 Rune 的开发。

我认为这篇文章有一些非常深的洞见:大语言模型的实质和能力、人与大语言模型的关系,等等。我会引用其中的这样一句话来做总结:“有人工才有智能”

总而言之,我并不反 AI,只是作为一个“表达者”,我不希望稀里糊涂地就把 AI 所生成的内容变成我的表达。说到底,AI 生成的内容本来就不是我要表达的东西。

为什么是 90%?

当然是因为:notbyai.fyi 是这么规定的.jpg。原文如下(为可读性起见,我对其用词和语序有所调整):

Not By AI 90%规定

在很难区分“什么是 AI 生成”与“什么是人类生成”的前提下,如果你估计自己的内容有 90% 是人类所创作的,你便能将 Not By AI 贴纸加到你的网站、部落格、艺术品、视频、论文、书、播客,或其他型态的非商业用途的作品。

……这 90% 可以包含使用 AI 来寻找灵感、生成隐私政策等法律文件(除非你的主题或服务本身与法律相关)、生成搜索引擎优化(SEO)等非用户会看到的代码、寻找语法错误和错字,以及翻译等。

也别忘了 Not By AI 并不是 AI 探测器。我们的努力是奉献给想主动宣示自己创作是原创的内容创作者,而不是寻找证据的人。这也代表了身为用户的你必须扛起遵循 Not By AI 90% 规定的责任。

毕竟较起真来,你说我已经看过了这么多 AI 写的东西,那我有没有可能潜移默化地受到 AI 的影响?必然是的。那你说影响了多少?鬼知道。

前面也提到了,我的目的其实是“表达我自己”,我希望我所表达的是经过我自己的考虑、斟酌后的成品。因此我认为,只要我表达的是我自己的东西,我觉得就符合这个标准。当然我们也可以具体定义一些行为:

  • 使用生成式 AI 创作文章的主体部分:不可以,这不是我自己的表达。
  • 使用生成式 AI 就结构、文法、语病、用词等内容获取建议:可以,这不妨害我自己的表达。
  • 使用生成式 AI 进行初步的文章灵感获取,或文本大纲的梳理工作:可以,这不妨害我自己的表达。

So on and so forth.

当然,这不排除我有可能会在某些情况下使用 AI 来生成文章并发布。这种情况下,我会将其明确地标注出来。

事实上我不是没用过 AI 写文章,但写的其实都是些体力活——那种高度格式化、模板化,本身就不需要我表达任何东西的文章。我把文章所需要的数据和信息喂给 AI,让 AI 帮我整理成文,交上去搞定了。谁家好人想天天干这种活啊.jpg

你好恐怖,认识你连 AI 都不能用了

哪有,没有的事.jpg。以上内容只是我自己的承诺,对我自己的一种约束。我不会仅仅因为“使用了生成式 AI”就对任何人有任何的评价。

或者我们换句话说,其实并不是完全不会有评价(毕竟我是人,我又不是天平),只是我们得看看场合。

比如说啊,你想搞个活动,然后你真的很需要一张海报,然后你用了 AI 来做海报。我觉得这其实也没什么特别需要苛责的,毕竟重点是活动,重点不在于你这张海报,活动又不是 AI 帮你搞的,虽然请人画海报确实会更好。

再比如说,你用 AI 生成了一首音乐,你又用 AI 生成了一个视频,然后你把二者结合到一起,标题写“原创音乐”,那我就不乐意了。AI 生成的东西绝不能说是“原创”,这是我的想法。

当然了,无论在什么情况下,使用了生成式 AI,就要承担使用它可能带来的风险,这当然就不是本文要讨论的东西了。我要说的只是:“我不会以我对自己的标准去评价他人使用 AI 的行为”。

其实有一句话我觉得很好——“不以词害意”。不要因为载体的问题而妨害了要表达的东西。AI 可以是载体,可以是一个媒介,关键在于你表达的具体是什么。说回到底,AI 无论如何都是工具,决定了最终的性质的,永远是把工具用作什么用途的人。


以上,零零散散说了这么多,希望把我要讲的东西说明白了。

最后修改:2025 年 02 月 11 日
如果觉得我的文章对你有用,请随意赞赏