我在想,AI时代与AI进行交互的最佳方式是啥?
发文字?但是发文字该如何发?是一个字一个字细致斟酌地发出去?还是直接发语音?或者直接用语音转文字的方式,把文字发出去?
经过我的实践,我觉得用语音转文字的方式是最好的。
键盘输入速度慢,还得把思维转成规范文本。这个过程里,你会不自觉地做取舍——文字虽然更规范、更准确,但也损耗了很多细微的想法。
如果直接发语音,效果和语音转文字其实是一样的。但有一个问题:你想回看以前的内容时,比较麻烦。特别是在聊天窗口里,语音怎么搜索?至少现在技术还搜索不到。你想看文字内容,得点一下转文字,有这个转换的过程,不方便。
最好的方式就是直接语音转文字。微信、QQ、飞书里面都有这个功能。各家效果不一样。我们普通人说话也不标准。比如我,作为四川人,平时都说四川话,前面提到的工具对四川话不太友好。但豆包对四川话的识别效果非常好。
用 OpenClaw 配合飞书效果也不错。飞书会把你说的话整理后再发出去,相对更规范。
更高效的办法是直接对着手机,语音转文字,把想说的尽量说出来。条理性也不必在乎——说话本来就很难一次说全,说漏了就边说边补。以前说错了,语音是线性的,收不回来,再说一次修正就行。
所以用语音转文字的时候,说完不用修改,继续补充就行。大模型的语言处理能力足够强,会自动判断对错,保留正确的部分。
所以,语音转文字是现在最好的与AI交互方式。 既快速,又能完整表达。一个东西说不清楚,可以反复多次描述,让AI真正明白你是怎么想的、要它做什么。
以后你看到有人对着手机一直说话,那多半就是在和AI聊天——比如现在的我。
语音转文字的高效,这里就是最好的证明——从开口到成文,全在手机上完成。