先说个得罪人的大实话:在币圈,你用输入法,本质上就是裸奔;你要再用那些闭源的 AI 语音输入,那是把裤衩都脱了,连密码一起递过去
*PS:全文将近 2400 字,建议你先收藏再慢慢阅读 *😘
我自己是个重度语音输入用户,连这篇文章,都是我口述出来的。但折腾了一圈下来,市面上能用的东西,要么不安全,要么不好用,没一个让我真正放心。所以我干脆自己写了一个,今天把它开源——PunkType
GitHub 地址:github.com/punk2898/PunkType
本文大纲:
⌨️在币圈用第三方输入法被盗只是时间问题
🔍有哪些方式可以作为 Typeless 的平替?
🛡️我为什么必须开发一个输入法?
🎤PunkType 到底牛在哪:三档速度 + 命令模式 + 个人词典
🚀One More Thing:Mac 版只是开胃菜
废话不多说,正文开始🙏
🧵🧵🧵
在币圈用第三方输入法被盗只是时间问题 ⌨

输入法是你手机和电脑上权限最高的软件,没有之一
你想想它能摸到什么——你敲的每一个字、每一次删除和修改、你的自造词、你的通讯录。更狠的是剪贴板,你复制过去的私钥、助记词、交易所密码,它全都看得见
第三方输入法是默认联网、云同步的,说白了,只要你用着云同步的输入法,你在键盘上干的一切,基本就等于在网上裸奔
在别的行业,泄露点聊天记录顶多尴尬。但在币圈,你输入的是私钥、是助记词、是几百万几千万的身价。这根弦一旦松了本金就没了
我不是吓唬你。这种"标榜隐私优先、实际偷偷把音频和窗口截图传到境外服务器"的事,2025 年就被人扒出来过不止一次。对币圈的人来说,这压根不是隐私问题,是身家性命问题
所以第一条铁律我先撂这儿:币圈的兄弟,年纪轻轻的千万别碰 Typeless 那类东西
有哪些方式可以作为 Typeless 的平替? 🔍

我也想要语音输入的效率,但我又不敢用 Typeless,那能用的其实就那么两个
2.1 ChatGPT 自己带的语音输入

准确度是真不错,识别得挺准。但它有个硬伤——不方便。你得先切到 ChatGPT 里头,说完,再复制,再粘回你要用的地方。一来一回,效率全耗在切窗口上了
2.2 是我测了很久才挑出来的——微信里那个语音输入(不是微信输入法)

它的处理方式我琢磨过,应该是先在本机做一遍语音转写,再用一个很小的模型做轻微的润色调整。这样隐私上就好很多,识别也够用
但它的死穴是没法个性化。我没办法让它按我的习惯、我的词汇、我的风格来。它是个标准件,给所有人用的,不是单给我一个人定制的
这就是我之前的临时方案。能用,但远远不够爽
总之,市面上摆在你面前的,就是"安全但难用"和"好用但不安全"这么个二选一。这俩我都不想将就
所以……
我为什么必须开发一个输入法? 🛡

我其实特别想用 TT 那种丝滑的体验,但我打死不敢信它。因为它至少有三道我控制不了的风险
3.1 公司作恶
这家公司今天说不上传你的数据,明天政策一改、被收购了、缺钱了,你的语音、你的剪贴板,就成了它账上的资产
3.2 开发者作恶
公司是好的,不代表里头每个能碰到代码的人都是好的。一个有权限的研发,想往你的数据流里塞点私货,你根本发现不了
3.3 黑客作恶
就算公司和人都干净,它把你的数据存在云端这件事本身,就是给黑客摆了个大靶子。AWS 上一个桶配错权限,几百万人的音频就全裸了
这三道里头,随便哪一道出事,最后买单的都是我自己
想明白这点之后,我的诉求就特别清晰了:我要一个开源的——所有代码摆在阳光底下,谁都能查它到底往哪儿发数据;我要一个方便的——别像 ChatGPT 那样来回切窗口;我还要一个能自定义 Prompt 的——按我自己的习惯随便改
市面上没有同时满足这三条的。那就自己写一个,这就是 PunkType 的出发点
PunkType 到底牛在哪:三档速度 + 命令模式 + 个人词典 🎤

终于能聊正事了。PunkType 的核心就一句话:我说话,它出字,而且出的是我想要的那个字
4.1 三档速度
最核心的设计,是我把语音输入分了三档:

1️⃣极速档—— 我这边话音刚落,那边字立马出来,几乎零延迟。平常你回个"好的""行""一会儿见",根本不用上 AI,直接转出来就完事,这一档效率最高
2️⃣润色档—— 你现在看的这篇文章,就是这么写出来的。我口述的时候难免前言不搭后语、带口水话,它顺手帮我清一遍、润一遍。日常工作里,这一档用得最多
3️⃣格式档—— 这是给重型文字工作者准备的。你写文章、写邮件、写汇报、写待办,它会帮你排好版、套好格式。文档活儿多的人,会爱死这一档
4.2 再说第二个杀手锏——命令模式

我在任何一个页面、任何一个 App、任何一个网页里,选中一段文字,直接说出我的命令:翻译、总结、查询、反驳、扩写……只要你说得出来,它就能干。干完弹个框出来,你想复制就复制,想直接插入就插入
前面三档解决的是"输入"的效率,命令模式解决的是"处理信息"的效率。这两块加一块,才算完整
4.3 还有个我特别得意的小功能——个人词典

你工作生活里那些高频的专有名词、黑话、项目名,它会自动记到你的个人词典里。你也能去个人中心手动编辑,错的改对,对的留着。这样那些只有你才会用的专属词汇,识别准确率会高到离谱。而且这玩意儿是不联网的,只跟大模型打交道,跟我没有半毛钱关系
再往后我还在迭代个人风格——等它摸清了你说话和写作的习惯,再帮你转写润色的时候,出来的东西会更像你自己,也更自然
把这些功能拆开看,它的底层特性是这样几条:
- 快:极速档真的就是话音刚落、字就出来
- 准还兜底:本地搞不定的,有 OpenAI 的 Whisper 云端兜底。这是个 MIT 开源、支持 99 种语言的狠模型,干净录音的转写错误率能压到 2.7%,质量非常高
- 隐私:因为你用的是你自己的 API Key,数据不经过任何中间服务商,直连大模型,完完整整属于你自己,安全到家
- 能配:你想接 DeepSeek、接 OpenAI,都行,在设置里自己填。提示词也能自己写死,你想让它按你的口味甚至写点骚话都没问题,懂的都懂
- 自定义快捷键:怎么顺手怎么来
- 彻底开源:MIT 协议,拿过去随便用,随便商业化,无所谓
而且因为是你自己的 Key,你基本上花不了几个钱,接个 DeepSeek 那点 API 成本几乎可以忽略,速度还飞快(默认的就是 DeepSeek 因为是真的便宜,你也可以改成别的)
One More Thing:Mac 版只是开胃菜
今天开源的这个,是 Mac 版的 PunkType
但我花时间最多的,其实是另一个——iOS 上的键盘版本。手机上能有这么一套安全、丝滑、还能自定义的语音输入键盘,那才是真正每天高频用得上的东西

那个版本我打磨得差不多了,过两天就开源出来。先给大家放个预览,到时候再见
最后求两件事:
第一,给个一键三连。这是对我最大的鼓励,也是我接着往下做的最大动力
第二,去 GitHub 顺手给我点个 Star⭐。拿东西的时候顺便给我打颗子弹,满足一下我那点虚荣心——这点虚荣心,也是对我这些活儿的认可
GitHub 地址:github.com/punk2898/PunkType
Mac 版先用着,iOS 键盘版,咱们下次见
工欲善其事,必先利其器

