这是用于实时语音识别/语音转文字/自动语音识别(STT/ASR)的客户端软件。
识别的文本可以通过WebHook或WebSocket实时获取。
我们计划支持各种人工智能服务。
- 支持的AI
- v.1.0.4 released
- source code is opened.
- win_std版:适用于Windows的版本,运行在CPU上。虽然比cuda版慢,但在现代规格较高的CPU上也可以运行。
- win_cuda版:适用于Windows的版本,运行在NVIDIA的GPU上。利用GPU硬件加速,可以快速运行。
- mac版:适用于Mac(Apple silicon(M1, M2, M3, etc))的版本。
你可以在Colab上运行此程序。
请访问这个笔记本,然后点击左上角的 Open in Colab 按钮打开它。
- 解压缩文件后,运行
start_http.bat。在浏览器中访问显示的URL。 - 使用
start_https.bat可以从远程访问。 - (高级用户)使用
start_http_with_ngrok.bat可以通过ngrok隧道进行访问。
注意:mac版请将.bat替换为.command。
- poetry: 如何安装
请执行以下命令:
git clone https://github.com/w-okada/asrclient.git
cd asrclient
cd third_party
git clone https://github.com/reazon-research/ReazonSpeech
cd ..
poetry install
请执行以下命令:
poetry run main cui
如果遇到 fatal error: Python.h: No such file or directory 类似的错误,请安装 Python 源代码。
sudo apt install python3-dev
如果遇到 No such file or directory: 'cmake' 类似的错误,请安装 cmake:
sudo apt-get install cmake
poetry remove onnxruntime-directml torch-directml
poetry add torch==2.3.1 --source torch_cuda12
poetry add onnxruntime-gpu==1.17.1 --source ort_cuda12
请执行以下命令,并在GUI中设置显示的webhook URL。
python .\client\webhook_server\generic_main.py
请执行以下命令,并在GUI中设置显示的webhook URL。
node .\client\webhook_server\generic_main.js
请执行以下命令。
将 http://localhost:20000 替换为ASRClient的启动URL。
poetry run python_socket_io http://localhost:20000
