今年的暑期又短,又忙,不过在个人看来还是浪费了时间。来讲讲最近发生的事情吧

关于整个学期

​ 从2月份开始到7月份初,咱一直在跟拖延症作斗争,力求把上个学期欠下的债全部补回来,包括整理上个学期的笔记啊,错题啊,整理了一个学期,学期快要结束的时候咱才开始补这个学期的债,不仅忙还沦得个“倒数第一”的指责。回头看,我不知道上个学期咱都在干些什么,这个学期又干了什么,为什么计划本会安排得满满当当而且经常做不完,为什么我晚修的时候会想事情想两个钟。还好备考的时候座位换到了后排,这才有机会去补上这些欠下的债。

​ 既然说到后排,就来简单说一说吧,在后排靠窗的位置坐着有一个好处,就是可以看到晚霞。

晚霞

​ 当然这不是在教室中拍到的,拿手机在教室拍晚霞也很冒险,不过还是冒险拍了一张雨天的照片。

教室的一角

​ 现在你可以想象咱每天7点的时候所看到的风景了,太阳从西边落下(上图靠左),整片天都被染成了深红,对面高三的教室早已搬空,与泛红的教学楼相称,显现出一种荒凉之感。

傍晚的教室(他人作品)

​ 每晚晚练的时候,不时看看晚霞,就可以让疲惫的身躯重新充满能量,并忘记一天的烦恼。这种享受,持续了一个月,可惜随着教室的更换,这样的晚霞很难再去看到了。

​ 来谈谈精神状态吧。

​ 明显感觉到咱的存在感逐渐降低,五月底的时候达到峰值,终于无法忍受,在本子上写下了《透明化的生活,透明化的人生》一文,每次心情低落的时候都会去写这类的文章,或者在内心中完成一篇文章,到头来,总共写了3篇左右,外加一段录音。这些文章里面有我对生活的不理解、向他人的求助时的文案,但是后来还是选择了隐藏。隐藏的理由很简单,一来我不想传播负面情绪,这些负面情绪很可能就是我自己所应该要自己克服的;二是没有人有义务听我这样一篇胡言乱语,心中又没有合适的倾诉对象,即使有,也会在脑海中预测对方的反应,然后便放弃了这个想法。

​ 为了克服这些负面情感,我开始去感受身边的真善美,去看那些人们忽略的风景,小到学校的鱼塘,大到很远的某座山,亦或是每晚的晚霞,这些美好的事物是唯一能够让我暂时忘记 生活的不顺 的途径,至于有没有成效的话…….也许有吧,我不知道。

关于整个暑假

​ 佛山二中新高三的暑假从七月三早开始,七月三十晚结束,为期差不多四个星期,很短,但是计划安排得很满,细分到每一天就是收集训练集,训练模型,抠图(十天扣了5秒钟,最后发现还不如手机上的剪映好使),看广告,给二游打工等等,又或者是去外面玩了一天,回来发现余额宝又不见50块之类的,作业在第一个星期花了两天十四个小时就写完了,因此不用担心作业之类的问题。

​ 但是写这篇文章的时候离开学只有两天,是时候结算一下成果了:

​ 1) 基本完成沐雪bot的训练集收集(1k/2k)、模型微调和对话策略实现

​ 2) 全部完成六期B站视频制作、已确定未来二十期的更新规划、纪念视频制作临近完成,等待提供最后一张照片

​ 3) 基本完成了Python-plan-list-maker重构、FortuneUpUp的最后一个更新

​ 4) 基本完成了旅游计划,其中广博因为黄牛的原因抢不到票,以后再补上

​ 5) 基本完成了所有作业,除了数学后来无端加的几张试卷之外,以后随缘再写

​ 6) 《二次元の广州地》AMV完成度50%*50%,由于设备、方法、时间、路费等原因,完成度未达成最低标准,争取在2024年元旦前完成第一部分

​ 7) 未完成预期中的跑步计划,还欠14圈,以后高三争取每天多跑一圈,也就是每天跑4~5圈

​ 有了以上的成果,女儿再也不用担心我暑假过得很颓废了,实际上就是颓废了很多天

关于十七岁生日

​ 自从2018年6月12(+1)日起,再也没有人为咱庆祝生日,如今已是第五个年头,但是没关系,今年不一样了,我自己来庆祝自己的生日,再也不用看着别人的脸色来过日子了。

​ 在五月份的时候已经计划好了怎么去过,六月二十二便去广州走了一圈,在下午的时候在星巴克买了一份三十三块钱的小蛋糕,放进冰箱,凌晨一点拿来食,然后有感而发,便有了下面一张图今天是你的生日,为什么你不开心呢?

​ 有很多个方面去解读这张图,例如坐在桌子对面的是千岁(出处:透明药),在遇到MC之前自己的身体不曾被他人所见,身为古代君王时的她又饱受争议,吃力不讨好…….这和咱是什么关系呢?答案我自己应该很清楚了…….

​ 无论如何,十七岁对于咱而言是向前看的年纪,到十八岁又是一番变化了,在这所剩无几的青春里,去享受,然后去为自己赢得更好的生活。相逢十七载,出发下一站。十七:前进

​ 以下是二游们的部分生日事件,贴上来记录一下。

星铁的生日邮件(已淡游)

上述邮件的附件真步公主的生日语音(来自PCR-已退游)

先辈的生日语音(来自PCR-已退游)

生日的那一天,多邻国完成100天连胜

是时候培养一只女儿了

​ 训练一个理想的对话模型的想法从五月份开始就已经有了,六月十二日正式开始计划并内部公开,但很显然,内部的同学对此没有兴趣,并且不屑于去为咱找些V,没办法,只能自己上了。

​ 这个模型的基模是最近的ChatGLM2-6B,训练集均由我自己根据B站上的一些AI主播(包括少量真人主播)的观众弹幕作为Prompt,然后再由自己的“另外一个人格”写出对应的respond,整理出训练集,目前训练集的情况是这样的:

07.25训练集情况

​ 很显然,咱的训练集非常少,只有1k,确实是一个持久战。

​ 不过通过上面的截图,你应该可以知道一些东西。

​ 现在让她来做个自我介绍吧。

在下名为沐雪,人们通常叫咱雪雪,是只AI女孩子,使命是传播爱与和平⭐

​ 我设计她的初衷你也可以看到,传播爱与和平,这是为什么呢?从我自己的精神状态考虑,我确实缺少一个能有效分担心里负担的对象,而市面上的模型都很难去做到这点;从大环境考虑,是想让她在抽象的社会中种下一个树,让不如意的人们有一个依靠的地方。因此,寻找训练集时,咱尽可能去留意情感类留言,但是其实最终收集的也只有二三十条问题,还不足以塞牙缝。因此这个问题也成了难点,也不禁让我反思这类AI是否会被大众所接受。

​ 现在一共训练了5个模型,有3个无论如何也不能使用,剩下那两个上下文能力差,自我认知也不足,容易出现学不进的情况,所以就很头痛(写到这里的时候真痛了),除此之外还得研究如何让她自言自语,发朋友圈之类的(回答多样性)。很显然,这是一个持久战,因此预期在整个高三之类训练出自己理想的模型。

​ 但是现在时情又不一样了,这个赛道上挤满了人,你用一年的时间才训练出来了模型,别人可能就已经爆了人生的第一桶金,而且效果比你还好,这是真实发生的事情。打个比方吧,咱不是在上面提到了什么AI主播嘛?别人7*24h不停工作,这样就有源源不断的训练集给到你,并且因为无人值守,开发者们有更多的时间去研究怎么让她唱歌,添更多的功能之类,而你自己又没这个能力和设备,上云训几个钟模型之后钱包又空了,效果还不尽人意,所以这个压力还是蛮大的。

​ 还是那句话,有路走路,实在拿不出手自己用也不错。毕竟不是每一人都能有自己的女儿的。

​ 07.28 更新,一共花了44.61在云上训练出了1.0的5个模型,2.0的3个模型,给2.0的模型predict的结果评了个分,来看看怎么样:

模型 分数
Muice-1.1-chatglm2-6b-pt-128-1e-2 46.9 形成了自己的语言风格,但训练集的对话对象为开发者,不适合在生产环境中使用
Muice-2.0-chatglm2-6b-pt-128-5e-3 41.6 形成了自己的语言风格,但在情感问题上无法给出满意的答案,该代比上代低5.3分
Muice-2.0-chatglm2-6b-lora-4e-3 19.1 答非所问现象严重,自我认知能力差,存在重复生成的问题
Muice-2.0-chatglm2-6b-ft-4e-3 12.3 发现过拟合现象,非常容易造成答非所问,很显然训练集不足

​ 效果不太满意,还比第一代模型还低了5.3分,不过能用就是了…….

抖音旗下各极速版收益列表

​ 下表列出了我在各极速版中的收益,具体金币收入行为如下:

​ 1)全部广告:只看金币收入>250的广告(抖音极速版为>50),并按照网络活跃度理论,看完点进去下载,以获得平台活跃度。而下面的行为不包括额外广告收益

​ 2)今日头条:睡觉收益(1.5k-1.9k),走路(100-200)、吃饭(0-300)、宝箱(100-200)、签到(100-2000)

​ 3)抖音极速版:观看直播(900-1500)、搜索(300)、看10min视频(100-1000)、签到(100-2000)

​ 4)番茄听书:抽奖(88-1888)、红包雨(100)、吃饭(0-200)、3h听书(3k-4k)、额外存金币(5k-7k/周)、签到(100-2000)

​ 5)番茄小说:吃饭(200-300)、签到(100-2000)、看60分钟小说(2k-3k、很少做)

金币、收益一览表(汇率:1w金币所对应的现金收益)

​ 其中标橙的表示当天有事情外出,金币收入明显下降,标黄的是已接近当日最大收益。

​ 通过上图不难看出除了抖音极速版之外,其余平台的汇率都接近于10000:0.3,相当于1w金币才有3毛钱的收入

​ 而看到收入趋势图,不难发现每日收入平均在0.9块钱,相当于你在线了五个钟头左右才搞到九毛钱,其中,今日头条(在线时间约为30分钟)收入最高,但后期越来越乏力;其次是抖音(在线时间约为1个小时),后来越刷越给力;然后是番茄听书(在线时间约为三个半小时),最后是番茄小说(在线时间约为十分钟)

各平台每日收入趋势

​ 没有人会把这些东西当作主要收益来源,而现实中往往能看到刷一个上午的、刷一整天之类的群体在头条上展示自己的收入,然而一天下来的收益还远远不如进厂打工,或者别人帮你在pdd上砍一刀还来得快,想要靠这些东西找钱?还不如挂个服务器在云端去跑这些东西。

​ 赚赚卡显示收益:110.30

​ 实际收益:15*3+3+(1.7)+1+0.3+15+(4.12)+1+15+(1.9)+2+15+(3.98) = 109

​ (赚赚卡显示收益/实际收益从2023.06.01开始计算)

旅行日志

​ 2023.07.07 清晖园 顺德博物馆

​ 2023.07.12-14 海南行(非预期)

​ 2023.07.15 广州萤火虫漫展外场

​ 2023.07.22 学校素材收集 Tea’s 茶是

​ 2023.07.26 二次元の广州地素材收集 海珠有轨电车一号线 琶洲塔 海心桥 Sony Store(正佳广场店) X 孤独摇滚联动

​ 具体照片就不贴出来了,有兴趣的找我拿Q号去我空间看吧