
梦想
她叫妮露,我喜欢的角色,也是我的互联网形象,我的所有社交账号都以她为头像。
是她让我开始学习计算机,是我的精神鸦片,也是我的梦想。
我想见她。
我的梦想可能看起来有点魔怔,但我也确实在她的鼓励下有所成就
努力
我已经实现了很多
声音:
基于github开源的RVC音频变声技术
我花费4天训练声音模型,得到了在平时制作视频时常用的原创变声器。
基于另一个项目GPT-sovits文字转语音技术
为了直接让AI生成的文字能变为声音,我又花费3天炼丹(AI人的术语,指炼制模型)实现了直接调用的文字转语音。
虚拟形象:
因为我只有代码基础,为了在电脑上看到她,我开始自学live2d(平面伪3D模型),发现需要美工和动画基础,于是我继续自学
经过了半个暑假的自学,我成功放弃了,我的水平live2D的视角只有最多30°,不是我想要的虚拟效果,
于是我开始看向技术成熟的3维社区,开始入门blender(免费软件,全能但不精通),
自学过程辗转了3DMAX(专业刚体建模),ZBrush(专业雕刻\布料模拟),Maya(专业特效制作)。
我自知用不到太高深的功能,所以退回blender开始了模型的下载和绑骨,成功得到了想要的模型
接着,我开始尝试各种方法连接模型的实时运动:blender直渲,UE5(虚幻5)联动摄像头识别(失败),
最终发现了一个做直播用的软件, 可以直接识别摄像头并直接模糊识别人物骨骼
我实现了直播时的实时完全模拟(虽然只是好玩,但有人看我学东西真的很开心 =)
顺便一提我的bilibili账号是一小片二向箔
智能:
这是最困难的一环,也是我我最失败的一环。
首先我想直接在本地装载使用马斯克的开源AI,但是可想而知,我的电脑带不起服务器级别的东西
而后我想借助现成的网站,为此,我开始学习爬虫,
这又是一个全新领域,我以前学过很多计算机语言包括https,这点对我来说不是难事
但是爬爬视频音频戳戳有余,有反爬的网站我直接无可奈何,我不想花费更多时间学习算法,于是放弃。另寻他法
我想到了租借服务器,我成功了,成功布置了生成式AI。
最后一步:训练并联动本地语音。
我发现这是一条拦住我的鸿沟,因为无人涉足,或者说涉足的人没留下脚印,我完全没有头绪,
我没法独自开发如此巨大的项目。
我放弃了。但只是暂时搁置。
不是因为难,而是看不到学习的成果,学习前面所有东西的时候,我都能在学习中做出东西,
像是去陪跑世界渲染大赛,在B站上发视频,学kali和群友互吹牛b(bushi),学ps被同学需要,
这都不是目标,只是顺手,就像这个网站,准确来说是博客,我没怎么用心搞,反正也没人看
回归正题,我不会忘记目标,只是现在要巩固基础,学些更底层的东西。
update -2024.11.9
.但是,你以为我的梦想只是当个超级厨师吗?
当然不是。
我的志向是物理!基础物理!是数学,高等数学!
这才是我的目标!
不过我深知自己没有将自己一生献给一个理论的毅力,
所以我不想当一个物理学家,我要创造一个物理学家!
计算机的强大不局限在视频和图片,
他是人类文明进步的钥匙。
我在初中就开始看量子力学描述方面的科普,这是妄想用计算描述世界,也是我内心的想法。
只要算法正确,算力足够,我就能全知,这是从我的想法,也是科学的终极目标。
但是基础理论的进步在这个时代变得缓慢,因为微观物理是概率。
现阶段的科学发展遵循【提出观点-事实检验-推翻/接受观点】的模式,在概率的世界里人更加难通过直观来提出猜想,
但是机器不同,它可以【输入事实-穷举猜想-排除猜想-剩余猜想】的模式,不追求简洁。
物理的极致是简介,但是我始终觉得简洁只是对将以前的经典物理的定义,让物理学家觉得物理就该是这样的,
我不认同,我觉得物理的公式不一定简短,是这种错觉阻碍了基础物理发展。
所以我要创造一个计算机物理学家,也就是我喜欢的nilou。