社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

#未被AI污染网络资源##ChatGPT诞生前干净网络#有人整理-20250612155838

量子位 • 4 周前 • 58 次点击  

2025-06-12 15:58

#未被AI污染网络资源##ChatGPT诞生前干净网络#

有人整理了一份“未被AI污染的”信息资源,搜集了2022年以前,ChatGPT还未诞生前的网络信息,做成一个类似数字避难所的网页。传送门在这:lowbackgroundsteel.ai

该网页的初衷很简单:生成式AI诞生之前,网络上的内容都是人写的。那时候的文字、图片、代码,没有经过AI生成,这些都是“宝藏”级别的原生态资源。

具体来说,该网页搜集了以下信息:

- 包括旧版Wikipedia快照、Project Gutenberg的公共领域书籍、GitHub的Arctic Code Vault归档代码等;

- 用户还能自行投稿推荐,补全更丰富的“干净数据”。

这个项目就像是信息时代的一个“时空胶囊”,保存人类内容创作的原始切片。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/183156
 
58 次点击