【Demo】基于 TensorFlow Lite 的 Android 端中文语音识别 - 资源下载

0 有用

10 下载

【Demo】基于 TensorFlow Lite 的 Android 端中文语音识别

文件列表（压缩包大小 9.13M)

免费

概述

MainActivity 为 Android 程序入口，初始化 UI 控件与其监听函数所在，肩负生成 TensorFlowInferenceInterface 对象与读取标签文件列表的任务、避免重复读取文件。
DreamCarcher 调用网络开源 api、其中通过 Android 官方提供的 AudioCapturer 提供录音功能与文件流，默认地将语音数据保存至手机指定目录下 farewell.wav 处。
Chain 调用 InitialDream 类的对象以获取处理好的语音数据，输入模型以得到返还的概率矩阵，通过 Argmax 函数识别出拼音序列下标后，传入标签文件列表得到最终结果，返还给 MainActivity 的 TextView 控件以显示于应用界面。
InitialDream 为数据读取与处理功能提供支持，在 Chian 的预测函数启动时会自动地初始化并运行，内部实现对 Wave 文件的读取、对其数据进行加窗处理，最终生成模型所需识别输入的操作。
AnnaUtil 包含 4 种静态变量与 4 种静态函数，前者用于提供录音标准帧速率与文件路径，后者包含对复数求模、对数组求 log(n+1)，整型数据转浮点数和一维数组内求 Max 数值下标，协助上述各类进行工作。