您是否曾经想创建自己的语音助手,例如 Alexa 或 Google Assistant?使用 Python 和一些第三方库,这比您想象的要容易!在本教程中,我们将逐步介绍使用 Python 构建简单语音助手的过程。
先决条件
在我们开始编码之前,我们需要安装一些库来为我们的语音助手提供必要的功能。这些包括:
speech_recognition
用于语音识别pyttsx3
用于文本到语音功能pywhatkit
用于设置提醒wikipedia
用于搜索维基百科pyjokes
讲笑话
要安装这些库,只需使用pip
Python 包管理器:
pip 安装 speech_recognition pyttsx3 pywhatkit 维基百科 pyjokes
设置语音识别和文本转语音
安装必要的库后,我们可以开始设置语音助手的基本功能。首先,我们需要导入speech_recognition
和pyttsx3
模块,然后初始化文本到语音引擎:
将speech_recognition导入为sr 导入pyttsx3 引擎 = pyttsx3.init()
接下来,我们将创建一个函数来处理语音助手的文本到语音方面。此函数将字符串作为输入并使用 pyttsx3 引擎大声读出文本:
def 谈话(文本): engine.say(text) engine.runAndWait()
现在我们已准备好设置语音助手的语音识别方面。我们将创建一个speech_recognition.Recognizer
对象并使用它来侦听来自用户的音频输入:
listener = sr.Recognizer() 以sr.Microphone()作为来源: audio = listener.listen(source)
获得音频数据后,我们可以使用该recognize_google()
函数将其转换为文本:
命令 = listener.recognize_google(音频)
根据语音命令执行操作
有了基本功能,我们现在可以创建一个循环来侦听语音输入并根据用户给出的命令执行操作。我们将从创建我们的语音助手将识别的命令列表开始:
commands = ["remind me", "wikipedia", "tell me a joke", "what time is it"]“提醒我”、“维基百科”、“给我讲个笑话”、“现在几点了” ] while True: 以sr.Microphone()作为来源: print ( "Listening..." ) audio = listener.listen( source) command = listener.recognize_google(audio) 如果 在命令中“退出” :break elif “wikipedia”在命令中: search_term = command.replace( “wikipedia” , “” ) talk(wikipedia.摘要(搜索词)) elif 命令中的“提醒我”: reminder = command.replace( "remind me" , "" ) hour, minute = map ( int , reminder.split( ":" )) pywhatkit.sendwhatmsg( "Title" , hour, minute, “提醒:” + reminder) elif “给我讲个笑话” 命令: talk(pyjokes.get_joke()) elif “现在几点了” 命令: current_time = datetime.datetime.now().strftime( "%I :%M%p") talk( "目前是"+ 当前时间)
listen()
在这个循环中,我们使用对象的函数监听音频输入speech_recognition.Recognizer
,然后使用该recognize_google()
函数将音频数据转换为文本。然后,我们根据已识别的命令列表检查命令并执行适当的操作。
例如,如果命令是“Wikipedia”,我们将在 Wikipedia 中搜索用户给出的术语。如果命令是“提醒我”,我们将使用pywhatkit
库来设置指定时间的提醒。如果命令是“告诉我一个笑话”,我们将使用pyjokes
库来讲笑话。
添加附加功能
当然,这只是您可以使用语音助手执行的操作的一个简单示例。为您的应用程序添加附加功能还有许多其他可能性。一些想法可能包括:
– 添加更多语音命令供助手识别
– 与其他 API 或服务集成以提供附加功能,例如回答问题或控制智能家居设备
– 改进语音识别和文本转语音功能,例如通过使用不同的语言或口音
只要有一点创造力和一些编程技巧,就有无限可能!
完整代码
import speech_recognition as sr import pyttsx3 import pywhatkit import datetime import wikipedia import pyjokes # 初始化文本到语音引擎 engine = pyttsx3.init() # 处理文本到语音的函数 def talk ( text ): engine.say(text) engine.runAndWait ( ) #语音助手 将识别的 命令列表 # 监听语音命令的主循环 while True : # 监听来自用户的音频输入 , sr.Microphone() as source: print ( "Listening..." ) audio = listener.listen(source) # 转换音频数据to text command = listener.recognize_google ( audio) #根据识别命令 列表检查命令用户给出的术语 search_term = command.replace( "wikipedia" , "" ) talk(wikipedia.summary(search_term)) elif "remind me" in command: # 使用pywhatkit库设置指定时间 提醒 reminder = command.replace( " reminder me" , "" ) hour, minute = map ( int , reminder.split( ":" )) pywhatkit.sendwhatmsg( "Title" , hour, minute, "Reminder: " + reminder) elif "给我讲个笑话" 在指挥: # 使用 pyjokes 库讲笑话 talk(pyjokes.get_joke()) elif "what time is it" in command: # 告诉用户当前时间 current_time = datetime.datetime.now().strftime( "%I: %M %p" ) talk( "现在是 " + current_time)
注意:如果您遇到“找不到 PyAudio”的错误,您可能需要单独安装 PyAudio 模块。您可以通过运行以下命令来执行此操作:
pip 安装 pyaudio
结论
在本教程中,我们介绍了使用 Python 和一些第三方库创建简单语音助手的过程。我们已经涵盖了设置语音识别和文本到语音功能的基础知识,并且我们已经了解了如何创建一个循环来侦听语音命令并根据这些命令执行操作。
有了这个基础,您现在可以开始构建自己的语音助手并根据需要添加其他功能。无论您是要创建供自己使用的个人助理,还是要构建更高级的语音助手供他人使用,Python 和这些库都提供了您入门所需的工具。
本站声明:
1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/tech/java/295245.html