智转技术笔记

语音识别

分析 Whiser、FunASR、Qwen3-ASR、SenseVoice 等主流离线 ASR 方案的优劣，记录在实际项目中的测试数据与选型决策过程。

📅 2026-06-20 🏷️ ASR · 技术选型 · FunASR

语音识别

记录在边录边转场景下，通过调整 max_end_silence_time、speech_noise_thres 等 VAD 参数，将碎片化句子从 9 行降至 4 行的完整过程。

📅 2026-06-15 🏷️ VAD · FunASR · 参数调优

本地推理

使用 llama-cpp 加载 Qwen2.5-7B 量化模型，在消费级显卡上实现会议纪要生成。涵盖 GGUF 适配、乱码修复、三层回退机制等工程细节。

📅 2026-06-12 🏷️ LLM · GGUF · llama-cpp

工程实践

记录从获取 Certum OV 代码签名证书到配置 SimplySign 云签名、集成 signtool 签名命令的完整链路，解决 SmartScreen 误报问题。

📅 2026-06-23 🏷️ 代码签名 · Certum · 软件分发

部署运维

面对含 PyTorch + CUDA 的大型 Python 项目，设计 COS + ModelScope 三源分发方案。涵盖体积优化、增量更新、512MB 内存限制下的安装器设计。

📅 2026-06-18 🏷️ PyInstaller · Inno Setup · 三源分发

离线语音识别技术探索与实践