社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

5分钟生成一档播客!AI播客会是AIGC的下一个赛点吗?

雷科技 • 2 月前 • 77 次点击  

来源:雷科技AI硬件组 | 编辑:三明治

不得不说,生成式AI真的改变了很多东西。
作为一个没啥艺术细胞的文科生,在生成式AI大模型出来前,我所能做到的“内容产出”,也就是挥动手指,敲击键盘,让数字信号夹杂着中文字符出现在电脑屏幕上,仅此而已。
但现在,哪怕本身对绘画一窍不通、对乐理更是毫无理解,只要懂得提示词的编写,我就能够轻松“制作”不同风格的画作、“产出”各种流派的音乐,就连播客这种号称“小而美”的传播媒介,似乎也没有那么神秘了。
3月25日,网易有道宣布有道文档FM开启公测。

8303d9e13f6df487b7fcc16023c247f.jpg

(图源:有道)
作为一款有声阅读、学习效率工具,有道文档FM号称支持拍照、文档、链接、长文本等多形式内容一键转播客,还能迅速提炼核心要点,生成简洁明了的总结与思维导图,让你一眼洞悉内容主旨。
我决定帮大伙试一下,是时候看看国产AI播客到底能不能打了。

「懒狗」也能做播客

想要体验有道文档FM,其实还蛮简单的。

打开自己手机上的应用商店,搜索“有道文档FM”,看到那个像蓝色气泡的图标点击下载就行。
反正现在是公测阶段,又不需要邀请码啥的,我的评价是有手都会。

4e142a86ba59201f19b1af338ac0ed7.jpg

(图源:雷科技)
打开应用,你会看到一些官方制作的播客示例。
我先是试着听了一下随应用附带的“《日航的奇迹》:飞向天际的涅槃”,基本上就是通过生成式AI对原作进行了比较简明扼要的剖析解读,AI主持人能够做到抑扬顿挫、自然停顿和模拟真人的吸气呼气声,听起来并没有明显的违和感。
当然了,这只是官方给出的例子,实际效果还得我们自己测试。
有道文档FM为用户提供了四种新建播客的方式,你可以拍照片、扔网址、扔文件,也可以只粘贴文字,需要注意的是,免费用户上传的文件不能超过5MB,需要开启会员之后才能扩展到20MB。

9bd4f046a16b4b439707360ce6a0518.jpg

(图源:雷科技)
在导入文本后,有道文档FM会提供包含文本朗读在内的二十种播客类型供用户选择,不同的类型会对转写后的播客脚本带来一定差异,然后可以选择你喜欢的音色,它提供了13种男性声线、11种女性声线,包括新闻男声、电台主播、深夜电台、元气青梅等。

新建项目 (4).jpg

(图源:雷科技)
为了测试转播客的效果,我特地准备了三段不同的文本。
为啥是三段,主要是因为免费体验次数只有三次。
a6a681ebgy1gplers6ti4j20w00w0762.jpg
第一段文本,是我早年间混迹SteamCN(今keylol)论坛所写的文章,《CRPG简述》,约莫着5000字左右的文本,刚好可以看一下这种亚文化内容转写的效果如何。
接下来,只要点一下生成,实测5000字的文本大约耗时2-3分钟,你就能得到一个大约六分钟的,由两个AI主持人进行“深度探讨”的中文音频播客。
内容如下,感兴趣的读者可以自己下载听一下:

ab3ff425cdcbf1c665e4d3d23d05142.jpg

(图源:雷科技)
从内容上来说,有道文档FM很会抓重点,基本能把稿件中的重要内容摘出来。
以这段播客为例,从主播A迷恋上《神界:原罪2》这款游戏作为引入,两位AI主播围绕着CRPG游戏类型的定义、CRPG游戏的起源以及发展过程,讲得那叫一个头头是道。

新建项目 (3).jpg

(图源:雷科技)
它还可以将稿件打碎,并用口语化语言,在两人一唱一和中表达出来。
第二段文本,是我去年参加的一次群访,采访的对象是机械革命创始人潘春节。
嗯...这次转化出来的播客脚本就显得有些死板了,不知道是不是因为对专访类内容资料不足的缘故,最终转化出来的播客脚本,基本就是两位AI主播在添加了一些语气词的情况下对原文进行复述。

新建项目 (2).jpg

(图源:雷科技)
幸好,除了这段播客外,为了方便阅读,有道文档FM还在页面上方给出了文字版,甚至还提供了AI总结和思维导图,让用户能够更有条理地抓住文本的知识点,怎么都是有用的。
第三段文本,是我在大学时撰写的一本三流小说,第一部分约7.5万字,正好可以测试一下有道文档FM的“小说剧场”选项。

诶,这次转写时间就长了不少,等了十几分钟后,有道文档FM总算是端出了一份长达35分钟的播客内容。
从转写的效果来看,有道文档FM确实能够识别角色的行动,并将背景、对话、行动以较合理的方式拆解并讲述下去,就是不清楚现在有什么BUG,导致这段播客中频繁出现“让我们继续这个引人入胜的故事”这句话。

新建项目.jpg

(图源:雷科技)
每当AI主播读到这句话,就会让人有种从内容中被抽离出来的感觉。
除此以外,目前有道的AI播客还有一些瑕疵。
比如有些男性声音,存在语速较慢,还无法控制语速的问题。
尤其是新闻男声和电台主播,男生磁性音色,再加上字正腔圆的咬字,或许会适合解说纪录片,但在播客中就过于突兀,相声评书的音色里甚至含有一些杂音,让人很是出戏。
但就目前来说,有道文档FM在内容上确实没有毛病,听感也算正常,最终产出的内容可能更接近于老师上课时的知识解读。
当然了,有道自己可以也是这样定位的。你可以对自己手头有的资料进行学习,也可以直接用公众号链接转播客,快速吸收今日要闻和知识,借助这玩意自带的DeepSeek,你甚至可以实现提出问题,DeepSeek给出回答,然后就能直接转写成播客内容吸收的体验。
比起放空大脑的享受,它的最大价值,或许还是丰富了学习的场景吧。

AI播客起风了?

事实上,AI播客的诞生距离我们并不遥远。
2024年9月,谷歌的NotebookLM推出了名为“Audio Overview”的功能,该功能可以将用户上传的内容转换为音频对话,由两位AI主播进行讨论,其内容流畅,音质逼真,仿佛真的有两个人在对谈。

image.png

(图源:NotebookLM)
作为整个类型的开创者,NotebookLM可能是这类产品里最有“创造力”的,因为它生成的脚本并不会拘泥于用户提供的内容,而是会在此之上进行相关内容的扩展,还能根据需要调整语速,男女主播吐字清晰,语音语调自然真实,在音频播放期间用户甚至可直接与AI主持人互动等功能。
对我们来说,这款产品最大的缺陷,估计是它只支持英文内容的生成这点吧。
不管咋说,这款产品的出现,让人们看到了AI播客的潜力。人们不但可以用它快速消化大量信息,把长篇大论变成有趣的对话,在做家务或者开车的时候"阅读"那些平时没时间看的文章,甚至可以用来准备演讲稿,听听别人(特别是AI)怎么看待你的观点。
受此影响,在AI技术的推动下,播客制作和分发变得更加便捷,涌现出了如“Listen Notes”、“Podcastle”、“Descript”等热门应用。这些平台利用AI语音转写、智能剪辑和音频增强等功能,大大降低了播客制作的门槛,使得更多人可以轻松地创建和分享自己的播客节目。
毋庸置疑的是,播客,将成为下一个AI涌入的赛道。
放在国外,这很顺理成章,因为播客在欧美算是个颇具市场号召力的领域,月度收听人数一度超过他们总人口的三分之一。
但在国内,一切大不相同,因为对中文互联网而言,播客一直都是种小众又有些神秘的存在,喜欢的人死心塌地,不懂的人隔着墙壁。

2e2eb9389b504fc2d562e5a0e984f01190ef76c6c747.jpg

(图源:抖音)
移动互联网的普及,让广罗大众早就习惯了视频和短视频的内容消费体系,上下滑动的手指和高速刷新的视频流,更是让超高速信息获取成为了一种习以为常的事情,也使得播客这种相对“慢”的音频形式与快节奏的互联网显得格格不入。
当然了,并非每个人都会沉迷于视觉带来的感官刺激,凭借其独特的陪伴感和深度,播客还是成功吸引了一批忠实听众和创作者。当你在早晚高峰的地铁上,看到有人戴着耳机“闭目养神”,却又时而露出神秘的笑容,那他很有可能是在听播客。
而我,恰好也算是个播客的“消费者”。
在我看来,播客并不是什么“更为纯粹和深刻的交流方式”,而是更接近于一种充分利用碎片化时间的媒介,它排除了视觉干扰,让你在通勤、运动、打扫卫生的时候,都能找到机会沉浸在对话和叙事之中,抓住一切时间汲取感兴趣的观点。
对效率至上主义者来说,这点真的挺难能可贵的。
只可惜,国内播客节目发展的情况,可远没有播客爱好者们想象的那么轻松,在亚文化播客圈里颇具影响力的“机核”,甚至在近一年时间里接连撤裁了多位核心主播,变现与热爱之间的冲突似乎正在愈演愈烈。
有道文档FM的存在,在一定程度上算是填上了“中文AI播客”这个市场的空白,它从学习的交互形式出发,将文档内容直接生成AI播客,给用户提供了一种对特定知识进行大量有效输入的方法,是一款非常适合学习的AI应用。
曾经小众的播客,会因为被教育场景盯上而不再小众吗?
或许只有时间能给我们答案。
End


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180408
 
77 次点击