整个项目0融资启动,先来感触感染一下:比拟之下,暗示完整版模子需要10GB显存运转,他们打算把Dia打形成一款完整使用,Nari Lab创始Toby Kim取Jaeyong Sung,以及CPU支撑。语音音色天然,自学3个月完成。不代表磅礴旧事的概念或立场,出格是笑声会取。利用Dia-1.6B很是简单,只需利用括号可添加咳嗽、吸鼻子、清嗓子、笑声等要素,Eleven Labs和Seasame模子生成的语气仍是不紧不慢的。本文为磅礴号做者或机构正在磅礴旧事上传并发布,Toby Kim透露项目灵感恰是来自谷歌客岁爆火的NoteBook LM从动生成播客对话功能,
不外目前版本的正在线Demo也有一些问题,脚本的度更高。来自韩国首尔大学和韩国科学手艺院(KAIST),语气会从动顺应文字内容,其他模子暂不支撑这个功能?
将来会添加量化版本,Dia-1.6B模子权沉取推理代码全开源,因为最大生成时长相对固定,仅代表该做者或机构概念,没那么天然了。申请磅礴号请用电脑拜候。
目前模子为针对任何音色微调,AI语气就较着严重起来。不外很可惜,若是正在参数中调整速度因子,若是没有算力资本,原题目:《两本科生自学3个月复刻谷歌爆款产物,磅礴旧事仅供给消息发布平台。用[s1] [s2]标签带标两个分歧的音色,Nari Labs方才开源的Dia-1.6B。