Py学习  »  aigc

秦艳华 王意欢:AIGC创作出版物的内容特征与读者接受度研究——基于亚马逊热销榜单的实证分析

北师大新闻传播学院 • 4 天前 • 32 次点击  

《AIGC创作出版物的内容特征与读者接受度研究——基于亚马逊热销榜单的实证分析》


秦艳华

王意欢

2025.11














摘要

文章基于亚马逊畅销书榜单数据,实证分析生成式人工智能创作出版物的核心特征与读者接受度。研究发现,AIGC出版物呈现实用导向与创新探索并存的特征:内容以文学类(33.4%)和综合性图书(24.6%)为主,主题集中于计算机技术(35.1%)与科幻(26.3%),写作风格偏向结构化说明(技术说明型占比44%);技术指南类书籍虽通过模块化框架降低认知门槛,但同质化严重(案例库重合度超60%);哲学类作品占比虽低(11%),却因深度内容稀缺形成市场缺口。读者接受度呈现显著两极分化,技术指南类因“实操性强”获得58%正面评价;而文学类作品则因情感密度不足、叙事断裂遭受较多批评;分析揭示,内容质量、技术伦理、用户体验及社会价值是影响读者接受度的核心维度。研究指出,当前AIGC出版物一方面通过模块化内容与低成本试错激活了长尾市场,另一方面因为深度缺失、文化适配不足及伦理争议制约发展。优化路径需聚焦垂直领域提供差异化方案、建立可验证的创作透明度体系、合理调整人机协作比例。

1. 研究设计

1.1 研究内容

本次研究选取亚马逊Kindle中截至2025年2月中旬署名GPT的热销榜前100名作为研究对象,凡是图书描述、特别说明或前言部分表明“主要内容由GPT生成”等类似声明书籍均包括其中。

本研究爬取研究对象的全部读者评论,运用语义网络分析技术处理评论文本,评估读者接受度和情感态度,探讨影响接受度的关键因素,分析读者对AIGC畅销出版物的接受度。针对样本集中57部书籍进行读者评论爬取,本研究共获得159条读者评论。

1.2 拟解决的关键问题

问题1:畅销的AIGC出版物呈现哪些共性内容特点?

问题2:读者对畅销的AIGC出版物持何种态度?影响因素有哪些?

问题3:内容特征与读者接受度之间存在怎样的联系?

1.3 研究方法与技术路线

首先,本研究基于样本集中亚马逊57部AIGC相关书籍进行内容分析,首先进行数据清洗与标准化处理,将复合分类标签(如“人机交互–信息技术”)拆分为独立语义单元,采用人工核对进行校验;统一署名规范化为“ChatGPT”,建立作者贡献类型编码表:AI独立生成(GPT单独署名)、人机共著(合作署名且GPT一作)、AI辅助(合作署名且GPT非一作)。 

其次,本研究对样本集中57部书籍的详细简介基于LDA进行主题模型分析,通过Jieba分词配合自定义词典(加入“提示工程”“伦理对齐”等领域术语)对文本进行停用词过滤与词形还原等预处理,使用Python gensim库实施LDA建模实现主题挖掘与分类,提取各主题前20个关键词并计算主题覆盖率(某主题在样本集中出现的频次占比),并对每个主题进行深入探讨与总结。

最后,本研究基于样本集中57部AIGC书籍的159条读者评论,首先进行文本预处理,清洗标点符号与非中英文字符,使用Jieba进行中英文分词,过滤停用词与低频词,确保核心概念准确提取。

2. 内容呈现实用主导与多元探索并存的特点

2.1 类别生产秩序重构:技术实用主义与人文探索的共生博弈

畅销的AIGC出版物样本集类别分布揭示技术实用主义与人文探索的博弈:文学类以33.4%的比例高居榜首;占比24.6%的综合性图书聚焦轻量化技术指南;占比19.3%的社会科学类与占比10.5%的哲学类跨界平衡批判与思辨;占比7.0%的艺术类与占比5.3%的自然科学类通过算法美学与轻量化科普突破固有边界。

2.2 效率与创新实验双轨并进:技术工具主导,科幻艺术拓维,多元边缘初探

商业、经济与管理(8部,14.0%)进一步细化垂直场景,如AI talent sourcing探讨AI招聘的伦理与效率,价格跨度大(2.99~19.99美元),高定价凸显专业内容的溢价空间,体现企业对技术增效的深度依赖。

创新拓展技术叙事可能,科幻(15部,26.3%)作为人文领域的最大类别,展现技术叙事的多样性。

多元探索并存,教育理论(2部,3.5%)如Stupid questions properly answered通过AI重构问答模式,推动知识传播革新,平均页数215页,兼具学术深度与工具性。

2.3 效率霸权下的创新困境:技术说明垄断市场,叙事实验高评难破结构枷锁

技术说明型与短平快指南满足效率需求,而创新叙事与结构虽受高评分认可,却因创作难度与市场风险占比有限。

2.4 技术中介化知识的结构性变革:认知重塑、人机张力与社会权力再配置

基于LDA模型对畅销书简介的深度解析,AIGC出版物呈现五大核心主题维度,共同映射了技术深度嵌入知识生产与消费后引发的结构性变革。

3. 实用依恋、实验憧憬与深度失落的情感交织

本研究系统解析AIGC出版物的内容特征谱系、量化评估读者接受度情况及核心影响因素。

3.1 整体评价的3极锚定:功能价值主导、深度缺失争议与伦理张力显影

3.2 接受度类型分化显著:技术指南高赞明显、文学艺术成争议重灾区

3.3 高频讨论中的认知断层与监督张力:工具层主导、人本层割裂与价值分化

(1)内容质量层面,正面评价聚焦“实用” “创新”“清晰”等关键词,许多读者因为“案例直接可用”而做出褒扬,表明大家对工具性内容的场景适配性需求明确;负面评价则集中于“空洞”“重复”“陈词滥调”等词汇(如“读后毫无收获”),说明业界的普遍认知是,自主算法生产内容往往陷入套路堆砌或者解读深度不足的困境。  

(2)技术应用维度,“革命性”“高效”“协作”等正向词汇(如“AI辅助写作效率翻倍”)与“剽窃”“替代人类”“伦理争议”等负面词汇(如“这是对人类创意的掠夺”)形成二元对立,揭示技术工具性与创作主体性之间的张力,这一现象在各种交流平台上均可以探察得到。

(3)用户体验方面,正面反馈多趋于“性价比超高”“便于理解”,有时候会用像“性能和成本都挺让人满意”这种说法;而负面评价指向“格式混乱”“插图低质”,由此可见,在极其完备繁复的AIGC出版相关体系里,人本交互与标准流程之平衡仍属欠缺。实际情况表明,这种状况潜移默化地影响了大众对其整体品质感受。

(4)社会价值领域,不少评论一边赞赏其“教育意义”“行业变革”“推动招聘智能化”;但另一部分词句却流露出类似“炒作”“缺乏深度”“纯属蹭热点”的质疑,从这些彼此对应的话语分布,可窥见市场针对AIGC出版物既充满实用期待,同时也存有思想深度上的怀疑色彩。各种观点彼此交错,呈现情绪温差较大的评价场域。

3.4 读者接受度受原创深度、透明伦理、场景效用、情感人性四维驱动

当前AIGC出版物面临的核心矛盾在于内容生产的工业化与读者对独特价值的渴求。

主动揭示数字产出降低伦理疑虑,隐瞒AI贡献的出版物(如未署名AI作者)易引发信任危机。

职场工具书需解决具体问题,而非空谈理论,案例需贴近真实需求,避免“纸上谈兵”。

文学类作品需平衡技术实验与人性化表达,AI生成内容若缺乏情感连贯性,即使技术新颖也难获认可。

4. AIGC出版物的优势、局限与改进方向

4.1 需求适配、多模态交互、动态迭代与利基覆盖的结构性优势

技术突破传统文本限制,多模式融合创造新型阅读体验,在出版物中实现图文、交互式内容的无缝整合。

AIGC赋予出版物突破传统叙事范式的可能性,创新型书籍采用“AI生成框架+人类情感锚点”模式,通过非线性叙事、多重视角拼接等手法制造阅读惊喜。

小众领域出版物的试错成本大幅降低,数据显示,57个样本中有17%属于宗教、冷门职业指南等其他超细分领域。

AIGC出版物通过动态迭代机制增强内容生命力,数据反馈实现内容实时更新,ChatGPT money guide采用“纸质书+在线数据库”模式,读者扫码即可获取最新提示词案例(每月更新200条),使静态书籍转变为“生长型知识库”。

4.2 同质化生产、文化适配失效与算法伦理危机的矛盾及其社会风险

当前AIGC出版物最显著的问题是工业化生产与内容价值失衡。

4.3 三维改进路径:垂直场景穿透、人机协作优化与透明化治理

突破AIGC工具书同质化困局的改进路径如下。

(1)需聚焦垂直领域提供独家洞见,将通用性提示词优化为针对法律文书撰写或医学报告生成的专用模板,使内容从“信息集合”升维为“解决方案”,必须完成从技术说明书到问题解决手册的转型,其价值衡量标准正在从“算法先进性”转向“场景适配度”。

(2)构建“人机双核”创作标准,结合书籍简介与读者评论可以发现,当AI承担素材生成占内容量60%~80%,人类负责结构设计与情感润色时,作品接受度达到最优平衡点,因此可以设立“AI基础层(60%)+人类升华层(40%)”的黄金比例内容价值分层模型。

(3)通过透明度体系和风险分级预警探讨伦理治理,创建区块链溯源标签为每部书籍生成唯一NFT证书,记录AI模型使用的每份训练数据的版权状态,存储关键章节的人工修改记录,通过收益分配智能合约按AI生成内容占比自动分配版税,如AI贡献70%则30%收益进入“人类创作者保障基金”。

论文信息

本文摘译自2025年第6期的《中国数字出版》,作者秦艳华、王意欢,全文见原刊。

排版丨陈曼宁

主编丨张蔚

审核丨祁雪晶

出品丨瞭望融媒体工作室


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/191548