广州“中厂”趣丸杀入AI圈:从游戏语音到大模型,靠兴趣打怪升级
这家公司名气不算大,但它有两个特别的地方:一是它是榜上唯一来自广州的企业,二是它原本是搞游戏语音和电竞的,跟AI看起来八竿子打不着。说白了,趣丸原本就是一家做兴趣社交的互联网“中厂”,旗下的TT语音在游戏圈算是小有名气,还运营着几支电竞战队。突然冲进AI领域,甚至推出了音频大模型和音乐大模型,还在搞社交类大模型,这让人不禁好奇:这家公司到底怎么回事?
从兴趣创业到AI转型,趣丸靠“折腾”走出来
趣丸的创始人宋克,是个80后,也算是典型的“从网瘾少年打怪升级成老板”的代表。他创业的故事挺“中二”,一开始就是靠打游戏挣钱,2013年刚来广州创业没多久,就靠打游戏赚到了人生第一桶金——29万。当时,他做的“TT语音”解决了游戏玩家最烦的一件事:打团时不用再发短信或者开QQ喊人,直接在App里语音沟通,效率高、成本低,用户嗷嗷叫好。
也因为有这种背景,宋克特别看重“兴趣创造价值”这件事。他在公司里常挂在嘴边的一句话就是:年轻人现在在玩什么,我们就要研究什么,去试一试、折腾折腾。趣丸的主线,始终围绕兴趣社交展开。
不过到了2021年,问题来了。虽然趣丸在“语音+社交”这条赛道上站稳了,但继续扩张时却频频碰壁。宋克说得很直接:“我们做的新产品全都失败了。”为什么?因为各条赛道基本都被巨头占满了,根本插不进去。
于是,趣丸决定换个思路。他们成立了一个内部项目组,起名叫“X”,专门研究各种新技术,不设KPI、不要求盈利,纯粹是去找灵感,找“下一个突破口”。
没想着做AI,却走着走着就进了局
一开始,趣丸探索的方向还真不是AI,而是围绕他们熟悉的语音场景来思考。例如,当时短视频和直播正在火起来,他们就想着,能不能搞一个技术,把主播的脸换成动漫脸?这样那些声音好听但不想露脸的人也能上镜。
这技术他们搞定了,但上线后用户反响却很差。很多人一看是“换脸主播”就立马划走,觉得这人肯定长得不好看才不敢露脸。结果项目直接被“冷藏”。
谁知道,到了2023年元宇宙突然爆火,数字人开始流行,换脸这个技术一下子又有用了。趣丸没浪费机会,立马跳进去,成了美团数字人直播的第一家技术供应商。
接着问题又来了:数字人的声音太“假”,太机械,没有感情,观众根本不买账。这时候宋克想到,大模型对文字理解的能力这么强,是不是也能拿来提升语音质量?说干就干,这就是趣丸音频大模型“MaskGCT”的起点。
原本只是为了补足产品体验,没想到这一脚就踏进了AI圈。
不是为了跟风做AI,而是看到真实需求
趣丸转型做AI,不是因为觉得AI“潮”,而是因为他们真的遇到了“非AI不能解”的问题。宋克说,他们不是为了做AI而做AI,而是在解决问题的过程中发现,AI能帮得上忙,于是才去做。
对他来说,ChatGPT的出现就是分水岭。以前也有AI,不过那时候更像是“人工+算法”,比如做AI作曲,你输入歌词,它会用预设规则生成旋律。效果虽然还行,但离“智能”差得远。
而ChatGPT带来的“生成式AI”,是另一种东西。它的上限特别高,有些时候生成出来的内容让人惊艳,虽然也可能有点“翻车”,但它的潜力巨大。
宋克意识到,这是一个新机会,而且是一个属于未来的机会。他做出一个决定:不等了,自己下场训练模型,积累数据,全力以赴做AI。
说干就干,CEO亲自逼预算:我们必须砸钱!
趣丸原本是家挺“保守”的公司,做事谨慎、花钱抠门,每个预算都审批很慢。但宋克这次换了个风格,他说,“我当时是逼着各部门报预算的”,要卡、要机器、要算力,一次性全批。公司也去和各种云厂商谈合作,抢资源。
因为动作够快,2023年那波显卡和算力紧缺潮,趣丸基本没受影响。2024年,他们在AI模型这块的预算就砸了1.45亿,这对一家中型互联网公司来说,绝对是重金投入。
这老板挺接地气的,走的也是实打实的路子,先搞兴趣社交、再整音频模型,不是盲目跟风,而是一步步折腾出来的成果。 说到底还是人家创始人脑子活,能折腾、敢下本,别看是中厂,干出来的事不比大厂差。 现在的ai行业确实是比较火爆的,但是感觉这个可是不大好的啊。
页:
[1]