Py学习  »  Python

高考后自学 Python 的我,做了款可以把学术论文变成 Galgame 的 AI 学术伴侣

有趣产品咖啡馆 • 1 周前 • 310 次点击  
有趣产品咖啡馆 Funny café :一个能让你更快接触到更多新鲜有趣好玩产品的地方。我会寻找市面上有趣的独立产品,向独立开发者们进行一对一的访谈,挖掘优质产品背后不为人知的故事(文末可加入群聊,有彩蛋!)。

1、先请您自我介绍一下,以及可以介绍下 Paper2Galgame 的功能和玩法。

我是来自佛山大学的大三学生,专业是机械设计及其自动化。平时比较喜欢编程和捣鼓 ai 技术。高三高考完后开始接触 python,大一的时候做过开源软件 ai-gal。

说回这个项目本身,paper2gal,顾名思义,就是把论文(paper)转换(to)视觉互动小说(galgame)的项目,上传好的论文,会有二次元美少女陪着你在这里一起讲解论文的知识,又或者是制造一个场景,让论文的内容能通过这个场景以及展开的剧情来向用户解释出来。

        扫码即可体验 paper2gal
        点击底部“阅读原文”也可直接跳转进行体验
          2、你之前的开源项目 AI-GAL 是基于 Ren’Py 的“Galgame 场景程序”,而且迭代很久。 这次 Paper2Galgame 为什么选择“论文”这个载体?做这款产品的灵感来源是什么?

          当时正好导师布置了看论文的任务,但是我真的很多地方都看不懂,就想着用一种轻松的方式来阅读论文,而且我之前也做过 galgame 相关的开源项目,所以我打算将论文与 galgame 两个毫不相关的东西结合起来,看看能不能产生出奇妙的化学反应。

          3、我看到您是用的 Gemini 多模态大模型对长文进行理解与逻辑推理,可以分享下算法选择、模型训练与成本控制的取舍吗?以及目前是否有自研的模块或独特的 Prompt Engineering 方案?

          说实话,如果你体验过 paper2gal,其实会发现效果不是特别好。项目目前还没做一些算法的优化来增强论文知识检索。

          可以期待一下后续的迭代,prompt 的话,目前用的是标准化 markdown 提示词限定规则来尽量约束 ai,同时使用 json 模式输出,以保证 ai 输出能尽量少地出错。

          4、如果遇到了比较硬核的内容,例如公式、图表、复杂实验设置、推导链条等,你怎么处理?如何避免 AI 胡编的?

          目前主要通过大模型的原生推理能力结合角色人设来解决。对于文本形式的公式和推导链,Gemini 3 能够很好地理解并进行逻辑重组。通过 Prompt 设定,让不同角色用自己的方式将晦涩内容转化为对话,尽量在保证准确性的前提下降低理解门槛。

          至于纯图片形式的图表,目前版本暂不支持,但后续会通过引入多模态识别来完善这一体验。

          5、您目前还是一名大三在读学生,而且从未系统学习过计算机或 AI 专业,通过自学完成了这个项目,在自学的过程中有遇到过哪些难以解决的问题吗?后来又是怎么解决的?

          说没有遇到困难是不可能的,但是其实没有想象中的这么困难。

          我目前使用的是 vibe coding,如果我想让 gemini 改项目的一处地方,例如我在做角色表情切换的时候就头疼,因为 ai 始终没能改到一版我理想中的效果,而且可能会随着提问次数的增加,ai 会把一堆乱七八糟的改动也给加进来,会导致项目变得十分臃肿。

          所以如果遇到 ai 改不好的地方,最多提问两三轮,如果 ai 还是改不好,就要回退版本到提需求之前,避免其他的改动,然后换一种思路提问,看看 ai 能不能正常的解决需求。

          6、目前产品是免费使用的,如果用户量上来,推理成本会爆,会考虑进行商业化吗?未来会有哪些迭代方向?

            这个项目不考虑商业化,目前的定位还是偏玩具。
            关于成本,我非常幸运获得了观猹平台的慷慨赞助,这直接覆盖了最昂贵的推理成本。因此,项目目前没有任何商业化压力,也不计划设立付费门槛。
            我的初衷非常纯粹:降低知识获取的门槛。未来我们将继续专注于优化体验,希望能让更多人体验到“在二次元里搞科研“的独特乐趣。
            7、后续的迭代方向是什么?是基于 Galgame 增加更多的“AI 学术伴侣”和互动玩法,还是基于科研领域增强 AI 对论文的理解和白话文解读?

            未来的话,有优先考虑做多选项支持,就是,像 galgame 那样,ai 可能会提一些问题,让用户有思考的机会,不过答错了也没关系,ai 也会耐心的给你解释。

            其次是图表增强,支持图片格式的图表和数据,以及加强数据的处理方法。然后在对话的过程中,ai 会在合适的时候将数据图表展示给用户。

            如果要说游戏性和论文实用性的比例的话,我目前是打算做三七开,游戏性 7,实用性 3,目前针对论文解读的工具市面上已经有很多了,没必要再挤进去。

            --- 以下问题是基于观猹上的评价进行提问 ---
            1、你一开始对产品的定位是“整活”,但观猹上很多人已经在用“科研工具”的标准来给你提需求了,你现在对 Paper2Galgame 的定位有没有变化?

            总体定位其实是不变的,还是以游戏性为主,但是鉴于目前对于论文解析的效果实在太差,所以最近的迭代方向还是以增强 ai 解析论文的方向来做,我希望的是在达到一定水准的论文解析的能力上,能给各位论文阅读者带来更大的放松和愉悦。

            2、加载过程中的小游戏好像大家都点不到🤣,你自己能点到吗?这个在观猹里还挺多人有提到的,这块你复盘过原因吗?

              确实存在这个问题,首先要跟大家说一声抱歉,其实我自己也很难点到,我当时想的是这个游戏只是无关紧要的一环,所以就没太着急处理,后面收到了很多小伙伴的吐槽,也是加急修复了,现在体验应该顺滑多了。

              3、好多观猹员提到希望有分支、选项、好感度、做题解锁等功能,你打算后续怎么来做?

                目前最主要的是分支选项功能,这是更新的下一步方向。对于好感度等的功能,我会根据社区的反响来决定是否往这方面更新。(感觉好感度这一块不是很好做)。

                另外,角色语音播放功能后面也会考虑推出。

                4、很多人吐槽“没有历史记录、回退不了、只能重传”,也有人想做“系列科目”。你打算怎么设计“文档库/存档/分类/复习”的体系,让 Paper2Galgame 不只是一次性的体验?

                  关于没有历史记录、回退不了、只能重传的问题,现在已经解决了,现在项目已经支持游戏内的回退对话和重玩,以及在游戏结束后,可以将此次的对话剧本导出,下一次就可以直接上传导出的对话剧本,直接进入游戏。

                  至于文档库等等的内容,可能实现起来难度有点大,短期内就暂时不考虑了。

                  5、有观猹员会觉得,产品对复杂论文(涌现、思维链这种)做不到专业解读,更多是情绪陪伴,你是怎么界定 Paper2Galgame 能力边界的?

                    即使是地表最强模型,在处理前沿复杂论文时确实存在幻觉或理解偏差,这是行业共性。但 Paper2Galgame 的核心定位不是‘替代专家’,而是‘认知破冰’。

                    面对复杂概念,Galgame 的对话机制强制模型将长逻辑拆解为短交互,这实际上利用了思维链原理提升了模型的表现。

                    此时,情绪陪伴不再是花瓶,而是对抗阅读枯燥感的功能性设计。

                    只要能让用户在轻松的氛围中理解论文 60% 的核心逻辑,并坚持读完,这个产品的使命就达成了。

                    6、有观猹员说未来 Paper2Galgame 应用场景不止科研阅读,研报、项目文档都很适合。你怎么看待这个观点?接下来最想打穿哪个“非论文场景”?为什么?

                      我非常认同这个观点。Paper2Galgame 的底层逻辑并非单纯的论文翻译,而是高密度信息的降维与情感化封装。人类的大脑天生更喜欢听故事而不是读说明书。

                      任何长文本、高认知负担、且结构化强的内容,本质上都是 Paper2Galgame 的潜在燃料。我做的是把“苦读”变成“互动”,把“枯燥的输入”变成“有反馈的对话”。

                      目前我打算深究下深度行业研报与财经分析,研报和论文一样,充满了专业术语、数据图表和复杂的逻辑推演,是典型的“价值极高但阅读体验极差”的文档。很多投资者、从业者迫切需要其中的信息,但往往在阅读前三页时就因枯燥而放弃。

                      7、在观猹的评价里,已经有人想招你去做“下一代 IP”了,你自己对未来路径是怎么想的?继续读研、独立开发、还是加入团队做更大项目?

                      我目前打算是先沉淀自身,加强我自己的硬实力。后面的话,可能会加入团队和大家一起做出更好更大更强的项目吧。

                      --- Funny café ---
                      PS. 有趣的产品越来越多,但能被看到的渠道却越来越贵、越来越卷。我想帮助 1000 位独立开发者,让他们的产品成功“出道”。目前进度是 221/1000。
                      PS-1. 我把 “有趣产品咖啡馆” 做成网站 [ funnycafe.top ] ,在这里,你可以查看所有的专访内容,独立开发者上架的产品,以及我用 ai 编程做的一些有趣产品,随时欢迎来试玩呀!
                      PS-2. 我正式加入「观猹」,成为特工丸子啦!这里是 AI 产品爱好者和创造者的社区,也是 AI 产品的「大众点评」。欢迎一起当「产品观猹员」,发现好用的 AI 产品;如果你是 AI 产品开发者,也可以来发布你的产品,让更多人看见!
                      复制链接 [ https://watcha.cn/ ] 浏览器打开(建议电脑端访问),或扫码下方二维码,即刻加入观猹!
                      PS-3. 各位热爱探索新鲜好玩产品的朋友, 有趣产品爱好者们的4群人数已满,同时5群也已新建,可加我好友,我拉你进群~
                      PS-4. 我新建了全女有趣产品爱好者群  ,群里的独立开发者是女生,群成员也是女生,在群里会分享女生会用到的一些app,后续也会邀请更多女生独立开发者进来分享, 加我好友,可以邀请你进群。
                      PS-5.  我想搭建全网最优质的独立开发者群。「有趣产品创造者们」的群聊开放入群啦,加我微信,备注告诉我你的产品名称,即可进群,创造者们来一起抱团取暖吧!
                      PS-6. 我在公众号里埋了100个彩蛋,在公众号中回复数字 001-100,随机查看一款有意思的产品,共100款有趣产品等你来发现!
                      往期推荐
                      1、我为女儿做了一款能在童话故事里当主角的 AI 应用!
                      2、学习AI编程后,我用三个月打造了4款App并登上AppStore免费榜单!
                      3、我想帮助 1000 位独立开发者让产品成功出道
                      4、因为轻度抑郁需要晒太阳,于是我做了款能精准估算晒太阳补维D的App!
                      5、让AI分身替你去旅游,我做了款打工人坐在工位上也能魂游万里的App!

                      Python社区是高质量的Python/Django开发社区
                      本文地址:http://www.python88.com/topic/191374