
WeClone:用微信聊天记录克隆数字分身

你有没有这种感觉,有些聊天记录虽然早就结束了,但你却一直舍不得删掉。不是因为内容多重要,而是觉得那些文字里还藏着“那个人”的一部分。现在呢,有个工具直接帮你把这个“感觉”做成了AI。
WeClone,一个突然在 GitHub 火起来的开源项目,干的事儿真的有点炸裂——它能把微信聊天记录变成“数字分身”,不止文字模仿得像,连声音也能克隆个八九不离十。我当时一看到介绍就震惊了,想法是大胆的,但它还真的实现了。
所以今天我们就来好好聊聊这个 WeClone,到底怎么玩、能干嘛、适不适合咱们普通人折腾。
WeClone 到底是啥?
简单说,它就是一个能“复刻你”的工具。你把微信聊天记录导出来,WeClone 就能用这些内容去微调一个大语言模型(比如 ChatGLM3 或者 Qwen2.5),再加上语音克隆的功能,你的“数字分身”就出来了。不仅会说话,还能用你(或者你朋友)的语气、表达方式、语音,跟你聊天。
甚至更狠的是,它还能部署在微信、QQ、Telegram、企业微信、飞书上,直接跟你在各种平台“再续前缘”。
你要是脑洞够大,完全可以用来:
- 模拟自己的AI小号,日常回复社交信息
- 克隆朋友或亲人的“数字影像”,保留某段记忆
- 用于内容创作,快速生产固定语气的内容风格
- 就图一乐,看看“我”能不能跟“我”聊得来
听起来有点黑镜那味儿对吧?不过WeClone还是很强调隐私和本地部署的,所有训练和语音处理都能在本地搞,不用联网交出你的聊天数据。
它都能做什么?
WeClone 的功能说白了就三大块:
1. 微调模型,让AI学会“你怎么说话”
你导出微信聊天记录之后,它会帮你格式化成问答对,然后用 LoRA 方式在轻量大模型上微调。也就是说,不需要太高的资源配置——一张16GB显存的显卡就能训练(我就是用的这个配的机器)。
训练完的效果确实挺惊艳的,不是简单的句子复读机,而是能抓住一些你说话的逻辑和语气,聊天的时候有“那味儿”。
2. 声音克隆,不止会说,还“听起来像”
WeClone 的另一个分模块是语音克隆。用 Spark-TTS 或 WavLM,只要 5 秒你或别人的语音样本,就能克隆个95%相似度的声音。重点是它不大,一个 0.5B 参数模型就够了,电脑负担不重。
这个功能是真的有点魔性,尤其是你拿自己声音训练完,再听AI用你语气说话的时候……别说,还挺上头的。
3. 多平台部署,哪里都能聊
最后它支持多平台部署,什么微信、QQ、Telegram、飞书,全都能上。部署也没多复杂,一行命令直接起服务,然后对接 AstrBot 就行了。
而且它还能像ChatGPT一样加系统提示词,控制AI怎么说话、扮演什么角色,超级灵活。
我是怎么玩的?
我自己是拿我和朋友的聊天记录试了一把,导出+清洗数据用了不到半小时,跑训练模型大概2个小时左右(数据不多),语音克隆部分更快,录了一段10秒语音就能用了。
部署好之后,我试着跟“他”聊了一会,说实话,那感觉有点复杂。不是说百分百一模一样,但有些话、语气、甚至是那种回怼的方式,真的有熟悉感。
另外我还玩了个有点恶趣味的点:克隆我自己,然后让自己跟自己吵架……结果吧,挺吵得起来的。
安装使用难吗?
不难,真的不难。它已经提供了一整套从环境配置、数据处理、训练到部署的教程,就算你不是程序员,跟着教程慢慢来都能搞定。
简单说,安装大概三步:
- clone 项目,配置虚拟环境(推荐用 uv,很快)
- 提取聊天记录,清洗数据(用 PyWxDump 超方便)
- 训练模型 + 声音克隆(时间稍微久点,但能看着进度条跑)
然后一行命令就能部署到聊天平台,整体体验还挺丝滑的。
最后
WeClone 这东西吧,一开始看觉得像个玩具,但真跑起来之后我才发现,它背后技术栈其实挺成熟的。
当然了,这玩意儿争议也不小,尤其是“复活亲人”“数字永生”这些概念,总归是触及了些情绪底线。但就产品本身而言,它非常完整,非常可玩,甚至还有点未来感。
我目前是把它当成一个“超个性AI”的训练平台来用,用来写剧本、写推文、或者当聊天陪伴都挺合适的。你如果本来就对AI感兴趣,又有一堆微信聊天数据,其实可以玩玩看,保证比想象中更惊喜。
感觉嘛,这玩意不只是“复刻记忆”,更像是在用一种新的方式,重新认识自己或者身边人。想试试的人,项目在 GitHub 上直接搜 WeClone 就能找到。
真的值得一玩。