🛡️ 全程离线 · 零数据上传 · 隐私绝对安全

智转AI · 离线语音转写系统

基于 Qwen3-ASR 双引擎（1.7B 高精度 + 0.6B 轻量级），智能适配 GPU/CPU 硬件。全程离线运行，零数据上传，音频永远不离开您的电脑。个人独立开发项目，支持 Windows 10/11。

字节上传云端

98%+

中文识别准确率

引擎自动适配

14+

核心功能

ARCHITECTURE

技术架构

双引擎驱动 + 本地 LLM，根据硬件自动选择最优方案。

🧠 ASR 引擎（语音转文字）

基于 Qwen3-ASR 模型，1.7B 参数版本提供高精度转写，0.6B 轻量版本适配 CPU-only 设备。GPU 可用时自动加载高精度模型，CPU 模式自动切换 Paraformer 引擎。内置 fsmn-vad 语音活动检测，支持边录边转。

高精度引擎

Qwen3-ASR 1.7B （需 GPU ≥ 4GB VRAM）

轻量引擎

Qwen3-ASR 0.6B （CPU 可用）

VAD 模块

FunASR fsmn-vad （语音活动检测）

标点恢复

ct-punc （中文标点智能补全）

🤖 LLM 引擎（AI 纪要生成）

集成 Qwen2.5-7B GGUF 量化模型，通过 llama-cpp 在本地推理。支持会议纪要、访谈摘要、待办提取等多种模板。GGUF 格式大幅降低显存需求，7B 模型在 8GB 显存下即可流畅运行。

模型

Qwen2.5-7B-Instruct （GGUF 量化）

显存需求

≥ 6GB VRAM （GPU 模式）

推理框架

llama-cpp-python （本地推理）

纪要模板

7 种预设（可自定义 prompt）

FEATURES

功能特性

17 项核心能力，覆盖从录音到导出的全流程。

🎙️

文件转写

支持 WAV / MP3 / M4A / FLAC / OGG 等主流音频格式，拖入即转，支持 GPU 加速与 CPU 回退。

🔴

实时录音转写

调用系统麦克风，录制同时实时输出转写文本，录制停止即完成，支持暂停 / 继续。

⏱️

长时段录音

无时长限制的连续录音模式，适合全天会议、课程讲座，录音文件自动保存。

📦

批量处理

一次拖入整个文件夹，自动排队转写全部音频文件，GPU 模式下支持并行加速。

🔒

全程离线运行

所有音频处理均在本地完成，零数据上传至任何外部服务器，断网环境完全可用。

🧠

AI 纪要生成

基于本地 Qwen2.5-7B 大模型，一键生成会议纪要、访谈摘要、待办事项 7 种文档（需 GPU）。

👥

说话人分离

自动识别并标记不同说话人（说话人A / 说话人B / …），支持多人会议场景。

📝

10 大行业词库

预置通用办公、IT互联网、金融、法律、医疗、政务、教育、传媒、销售客服、工程制造词库，支持自定义热词表上传。

⚡

CUDA GPU 加速

支持 NVIDIA CUDA 11.8+，1.7B 模型 GPU 推理速度可达 CPU 的 20-50 倍。

🔄

CPU 自动回退

无 GPU 或显存不足时，自动切换到 CPU 模型，无需手动配置。

📄

多格式导出

支持 TXT / Word / SRT 字幕 / JSON / CSV 五种格式，适配不同下游用途。

🎯

VAD 智能分段

内置 fsmn-vad 语音活动检测，自动静音切分长音频，提升转写覆盖度和句子完整性。

📂

历史记录管理

自动保存所有转写记录，支持搜索、删除、重新导出，转写结果不丢失。

🔐

加密授权保护

一机一码硬件绑定 + 多层防篡改机制，保护软件著作权。授权码本地校验，无需联网验证。

USE CASES

适用场景

特别适合对数据隐私有严格要求的专业场景。

⚖️

政务办公

涉密会议录音本地转写，数据不离开内网环境

🏛️

律师行业

庭审、客户会谈录音离线处理，保护当事人隐私

🏥

医疗机构

患者问诊、病历录音本地转写，符合个人信息保护要求

🏢

企业会议

战略会议、内部讨论全程离线转写，商业机密不外泄

🎓

高校研究

学术访谈、田野调查录音转写，支持学术研究场景

📰

媒体采访

记者采访录音快速转文字，支持导出 SRT 字幕

SETUP

安装与使用

三步完成部署，30 分钟免费试用全部功能。

下载安装

获取安装包后双击运行，按向导完成安装。首次启动会自动下载所需的 AI 模型（约 2-6GB，视硬件自动选择）。安装过程全程本地，无需联网注册。

试用体验

安装完成后自动获得 30 分钟免费试用，期间可体验全部功能。拖入音频文件或点击麦克风图标开始实时录音转写。满意后再获取授权码激活。

获取授权

打开软件获取机器码，联系我们获取授权码，输入后即激活。授权码本地校验验证，一机一码绑定。换电脑可申请免费迁移授权一次。

FAQ

常见问题

真的完全离线不需要联网吗？▼

是的。所有转写、纪要生成等核心功能均在本地完成，无需联网。唯一的例外是首次启动时需下载 AI 模型文件（仅一次），后续使用完全离线。您可以在断网环境下正常使用全部功能。

安装会不会被杀毒软件拦截？▼

软件已完成正规代码签名认证（Certum OV 证书），大部分杀毒软件不会报警。极少数安全软件可能因内置 AI 模型文件体积较大而提示"未知文件"，添加信任区即可。软件无捆绑、无后门、无联网行为，请放心使用。

准确率怎么样？▼

基于 Qwen3-ASR 模型，中文常规场景准确率 98%+。支持方言识别、多人对话场景。建议先试用 30 分钟，用自己的录音实测效果。

支持什么音频格式？▼

支持 WAV / MP3 / M4A / FLAC / OGG / AAC / WMA 等主流格式。采样率自动适配，推荐 16kHz 以上以获得最佳转写效果。

换电脑了还能用吗？▼

支持免费迁移授权一次。新设备生成新的机器码后联系我们即可。超过一次的重新绑定需另行获取授权。

支持 Mac 吗？▼

目前仅支持 Windows 10/11 64 位系统，Mac 版本在开发计划中。最低硬件要求：8GB 内存、4GB 可用硬盘空间（不含模型）。

CONTACT

联系开发者

技术交流 · 授权咨询 · 反馈建议

📧 联系方式

微信：aizhizhuancn
邮箱：aizhizhuan@qq.com
官网：aizhizhuan.cn

⬇ 免费下载试用（Windows）

下载安装后即可享受 30 分钟全功能免费试用