环球速递!230423-blivechat-新功能探讨

2023-04-23 08:08:44 来源:哔哩哔哩

#blivechat##弹幕姬##新功能探讨#

我是一个三年热度的熊,@卉Sir, @沐之风MF, 能做喜欢做的事情,很大一部分得感谢我的父母,还有这个互联网。在这里冲浪每天都能有新发现,从一开始贴吧大佬的经验分享,B站搬运的视频我开始做MAD、学习编曲、再到研究开源项目 blivechat 写点免费CSS弹幕样式分享给大伙儿,再到给 blivechat 加点小功能,给开源项目做点小贡献。无不依赖别人分享的知识和他人的支持(blivechat相关的爱发电已经超过1W元,包含了5000+的弹幕样式比赛部分)

(渐入正题)以前有人给我提了一嘴,说有社团内部的积分系统,可以联动blivechat,应该是存储了弹幕数据到数据库等等……,当时的我觉得这个功能实现挺麻烦,一般使用的个人也不一定会需要(实际上还是有几位主播跟我提过类似的需求)


(资料图片仅供参考)

“B站198、138舰长这样的价格有些高,希望能给喜欢用礼物、SC支持自己的观众一些回馈”

“有办法能统计某个用户在直播间送过的礼物吗…”

✨需求合理,只是我技术力不行,以及轻视了数据对大伙儿(或一部分人)的重要性。

直到最近我发了一个关于AI直播助手的视频 

在这之后我开始着手怎么让这个AI更会回复弹幕,更合理的对话。在这个过程中我看了很多 LLM 的GitHub仓库,看了相关的论文,仿佛又回到了刚开始看贴吧大佬的经验分享一般,这些开源的知识是如此可贵。但AI和人一样,需要学习,需要有输入才能够输出……,我开始意识到了数据的重要性。

而这里的数据…要怎么来

可以看到我3月底4月初的几条动态,我开始试着去在录制自己的直播,别人的直播,主播是怎么回复弹幕的,这样弹幕就是 input,主播的回复内容就会是 AI 需要去学习的 output。—— 如果没有经过主播同意,使用这些数据这不就和一些 AI 绘画模型训练的方式一样糟糕吗?

确实是的,怀着这样的想法,我一开始只挑选了几个样本来论证可行性,而最近差不多要到实际训练的部分了。我想到了blivechat……

这次新增的功能预计可以满足:

✨直播

查看每场直播中的互动数据(包括进入房间,弹幕,礼物,及其价值等)

查看多场直播中的互动数据

✨观众

查看每个观众在直播间的所有互动数据(包括进入房间,礼物等),比如几月几号说了什么,几月几号上舰了,上一次来直播间是什么时候

查看每个观众每个月份(每个期间)的互动数据

✅ 关于新功能的说明到这边就结束了,但是在这些数据文件里面,每场直播的弹幕数据,正好就能作为 AI 的学习数据的输入,而录播,麦克风的音频文件正好就能作为 AI 的学习数据的输出……

blivechat可以记录弹幕数据,所有的文件都只存在本地(代码依旧开源),大伙儿的直播软件可以录音(mkv视频格式分轨能单独提取麦克风音频最为理想)

我很想要,但是数据和决定权仍然在大伙儿手上。我知道培养AI和养儿育女和一样要花钱,而恰好这次可以把爱发电的收入回馈给大伙:

✨效果较好的每10条 input-output 数据我会给1元RMB——而AI说话的方式则会有你的那部分影子,就像孩子身上多少还有父母的影子。(如果是杂谈直播100条弹幕里面大概会有10条左右效果较好的数据)

你可以选择上传1份或多份弹幕数据和麦克风录音数据(可多次提交问卷),这些数据你也可以修改后再上传(如果麦克风语音包含了隐私,可以静音掉,弹幕记录可以删去)

你可以选择这部分数据的使用方式,如是否开源等(可能被用作论文的实验数据,开源贡献给大伙儿使用等)

大概之后会有一个问卷用来征集资料

还有很多想和大家聊的,也很想听听大伙儿的意见(无论是关于AI还是这条动态)

评论区回复,参与这个投票都可以:

如果有兴趣可以来 KOOK(开黑啦) 聊聊: https://kook.top/dHWldJ

或者QQ群:934335201

最后还是感谢大家的支持

⚡爱发电:https://afdian.net/@doodlebear

关键词:

推荐内容