首页 / 项目文档
🛡️ 全程离线 · 零数据上传 · 隐私绝对安全

智转AI · 离线语音转写系统

基于 Qwen3-ASR 双引擎(1.7B 高精度 + 0.6B 轻量级),智能适配 GPU/CPU 硬件。全程离线运行,零数据上传,音频永远不离开您的电脑。个人独立开发项目,支持 Windows 10/11。

0
字节上传云端
98%+
中文识别准确率
2
引擎自动适配
14+
核心功能

技术架构

双引擎驱动 + 本地 LLM,根据硬件自动选择最优方案。

🧠 ASR 引擎(语音转文字)

基于 Qwen3-ASR 模型,1.7B 参数版本提供高精度转写,0.6B 轻量版本适配 CPU-only 设备。GPU 可用时自动加载高精度模型,CPU 模式自动切换 Paraformer 引擎。内置 fsmn-vad 语音活动检测,支持边录边转。

高精度引擎
Qwen3-ASR 1.7B (需 GPU ≥ 4GB VRAM)
轻量引擎
Qwen3-ASR 0.6B (CPU 可用)
VAD 模块
FunASR fsmn-vad (语音活动检测)
标点恢复
ct-punc (中文标点智能补全)

🤖 LLM 引擎(AI 纪要生成)

集成 Qwen2.5-7B GGUF 量化模型,通过 llama-cpp 在本地推理。支持会议纪要、访谈摘要、待办提取等多种模板。GGUF 格式大幅降低显存需求,7B 模型在 8GB 显存下即可流畅运行。

模型
Qwen2.5-7B-Instruct (GGUF 量化)
显存需求
≥ 6GB VRAM (GPU 模式)
推理框架
llama-cpp-python (本地推理)
纪要模板
7 种预设 (可自定义 prompt)

功能特性

17 项核心能力,覆盖从录音到导出的全流程。

🎙️
文件转写
支持 WAV / MP3 / M4A / FLAC / OGG 等主流音频格式,拖入即转,支持 GPU 加速与 CPU 回退。
🔴
实时录音转写
调用系统麦克风,录制同时实时输出转写文本,录制停止即完成,支持暂停 / 继续。
⏱️
长时段录音
无时长限制的连续录音模式,适合全天会议、课程讲座,录音文件自动保存。
📦
批量处理
一次拖入整个文件夹,自动排队转写全部音频文件,GPU 模式下支持并行加速。
🔒
全程离线运行
所有音频处理均在本地完成,零数据上传至任何外部服务器,断网环境完全可用。
🧠
AI 纪要生成
基于本地 Qwen2.5-7B 大模型,一键生成会议纪要、访谈摘要、待办事项 7 种文档(需 GPU)。
👥
说话人分离
自动识别并标记不同说话人(说话人A / 说话人B / …),支持多人会议场景。
📝
10 大行业词库
预置通用办公、IT互联网、金融、法律、医疗、政务、教育、传媒、销售客服、工程制造词库,支持自定义热词表上传。
CUDA GPU 加速
支持 NVIDIA CUDA 11.8+,1.7B 模型 GPU 推理速度可达 CPU 的 20-50 倍。
🔄
CPU 自动回退
无 GPU 或显存不足时,自动切换到 CPU 模型,无需手动配置。
📄
多格式导出
支持 TXT / Word / SRT 字幕 / JSON / CSV 五种格式,适配不同下游用途。
🎯
VAD 智能分段
内置 fsmn-vad 语音活动检测,自动静音切分长音频,提升转写覆盖度和句子完整性。
📂
历史记录管理
自动保存所有转写记录,支持搜索、删除、重新导出,转写结果不丢失。
🔐
加密授权保护
一机一码硬件绑定 + 多层防篡改机制,保护软件著作权。授权码本地校验,无需联网验证。

适用场景

特别适合对数据隐私有严格要求的专业场景。

⚖️

政务办公

涉密会议录音本地转写,数据不离开内网环境

🏛️

律师行业

庭审、客户会谈录音离线处理,保护当事人隐私

🏥

医疗机构

患者问诊、病历录音本地转写,符合个人信息保护要求

🏢

企业会议

战略会议、内部讨论全程离线转写,商业机密不外泄

🎓

高校研究

学术访谈、田野调查录音转写,支持学术研究场景

📰

媒体采访

记者采访录音快速转文字,支持导出 SRT 字幕

安装与使用

三步完成部署,30 分钟免费试用全部功能。

1

下载安装

获取安装包后双击运行,按向导完成安装。首次启动会自动下载所需的 AI 模型(约 2-6GB,视硬件自动选择)。安装过程全程本地,无需联网注册。

2

试用体验

安装完成后自动获得 30 分钟免费试用,期间可体验全部功能。拖入音频文件或点击麦克风图标开始实时录音转写。满意后再获取授权码激活。

3

获取授权

打开软件获取机器码,联系我们获取授权码,输入后即激活。授权码本地校验验证,一机一码绑定。换电脑可申请免费迁移授权一次。

常见问题

真的完全离线不需要联网吗?
是的。所有转写、纪要生成等核心功能均在本地完成,无需联网。唯一的例外是首次启动时需下载 AI 模型文件(仅一次),后续使用完全离线。您可以在断网环境下正常使用全部功能。
安装会不会被杀毒软件拦截?
软件已完成正规代码签名认证(Certum OV 证书),大部分杀毒软件不会报警。极少数安全软件可能因内置 AI 模型文件体积较大而提示"未知文件",添加信任区即可。软件无捆绑、无后门、无联网行为,请放心使用。
准确率怎么样?
基于 Qwen3-ASR 模型,中文常规场景准确率 98%+。支持方言识别、多人对话场景。建议先试用 30 分钟,用自己的录音实测效果。
支持什么音频格式?
支持 WAV / MP3 / M4A / FLAC / OGG / AAC / WMA 等主流格式。采样率自动适配,推荐 16kHz 以上以获得最佳转写效果。
换电脑了还能用吗?
支持免费迁移授权一次。新设备生成新的机器码后联系我们即可。超过一次的重新绑定需另行获取授权。
支持 Mac 吗?
目前仅支持 Windows 10/11 64 位系统,Mac 版本在开发计划中。最低硬件要求:8GB 内存、4GB 可用硬盘空间(不含模型)。

联系开发者

技术交流 · 授权咨询 · 反馈建议

📧 联系方式

微信:aizhizhuancn
邮箱:aizhizhuan@qq.com
官网:aizhizhuan.cn

⬇ 免费下载试用(Windows)

下载安装后即可享受 30 分钟全功能免费试用