python pyaudio音频录制的实现

Python
526
0
0
2023-05-22
目录
  • python pyaudio音频录制
  • 安装所需要的包
  • 监听麦克风
  • 监听系统声音
  • 编写代码
  • 调用pyaudio库录制以及播放wav音频文件
  • Pyaudio简介
  • 功能
  • Pyaudio安装
  • 使用Pyaudio进行录音
  • 使用Pyaudio库播放录音
  • 总结

python pyaudio音频录制

安装所需要的包

pip install pyaudio

监听麦克风

import pyaudio
import wave
def luyin():
    # 实例化一个对象
    pa = pyaudio.PyAudio()
    # 打开声卡,设置 采样深度为16位、声道数为2、采样率为16、输入、采样点缓存数量为2048
    stream = pa.open(format=pyaudio.paInt16, channels=2, rate=16000, input=True, frames_per_buffer=2048)
    # 新建一个列表,用来存储采样到的数据
    record_buf = []
    # 然后就通过声卡循环采用,采样到一定数据后即可停止采样
    count = 0
    while count < 8 * 5:
        audio_data = stream.read(2048)  # 读出声卡缓冲区的音频数据
        record_buf.append(audio_data)  # 将读出的音频数据追加到record_buf列表
        count += 1
        print('*')
    stream.stop_stream()
    stream.close()
    pa.terminate()
    wf = wave.open('02.wav', 'wb')          # 创建一个音频文件,名字为“01.wav"
    wf.setnchannels(2)                      # 设置声道数为2
    wf.setsampwidth(2)                      # 设置采样深度为
    wf.setframerate(16000)                  # 设置采样率为16000
    # 将数据写入创建的音频文件
    wf.writeframes("".encode().join(record_buf))
    # 写完后将文件关闭
    wf.close()
if __name__ == '__main__':
    luyin()

插入麦克风

录制启用麦克风

监听系统声音

要求

  • 系统不能静音,需要插入耳机
  • 设置录制为立体混声

编写代码

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime
# 需要系统打开立体声混音
# 录音类
class Recorder():
    def __init__(self, chunk=1024, channels=2, rate=44100):
        self.CHUNK = chunk
        self.FORMAT = pyaudio.paInt16
        self.CHANNELS = channels
        self.RATE = rate
        self._running = True
        self._frames = []
    # 获取内录设备序号,在windows操作系统上测试通过,hostAPI = 0 表明是MME设备
    def findInternalRecordingDevice(self, p):
        # 要找查的设备名称中的关键字
        target = '立体声混音'
        # 逐一查找声音设备
        for i in range(p.get_device_count()):
            devInfo = p.get_device_info_by_index(i)
            # print(devInfo)
            if devInfo['name'].find(target) >= 0:  # and devInfo['hostApi'] == 0:
                # print('已找到内录设备,序号是 ',i)
                return i
        print('无法找到内录设备!')
        return -1
    # 开始录音,开启一个新线程进行录音操作
    def start(self):
        threading._start_new_thread(self.__record, ())
    # 执行录音的线程函数
    def __record(self):
        self._running = True
        self._frames = []
        p = pyaudio.PyAudio()
        # 查找内录设备
        dev_idx = self.findInternalRecordingDevice(p)
        if dev_idx < 0:
            return
        # 在打开输入流时指定输入设备
        stream = p.open(
            # input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
        # 循环读取输入流
        while (self._running):
            data = stream.read(self.CHUNK)
            self._frames.append(data)
        # 停止读取输入流
        stream.stop_stream()
        # 关闭输入流
        stream.close()
        # 结束pyaudio
        p.terminate()
        return
    # 停止录音
    def stop(self):
        self._running = False
    # 保存到文件
    def save(self, fileName):
        # 创建pyAudio对象
        p = pyaudio.PyAudio()
        # 打开用于保存数据的文件
        wf = wave.open(fileName, 'wb')
        # 设置音频参数
        wf.setnchannels(self.CHANNELS)
        wf.setsampwidth(p.get_sample_size(self.FORMAT))
        wf.setframerate(self.RATE)
        # 写入数据
        wf.writeframes(b''.join(self._frames))
        # 关闭文件
        wf.close()
        # 结束pyaudio
        p.terminate()
if __name__ == "__main__":
    # 检测当前目录下是否有record子目录
    if not os.path.exists('record'):
        os.makedirs('record')
    print("\npython 录音机 ....\n")
    print("提示:按 r 键并回车 开始录音\n")
    i = input('请输入操作码:')
    if i == 'r':
        rec = Recorder()
        begin = time.time()
        print("\n开始录音,按 s 键并回车 停止录音,自动保存到 record 子目录\n")
        rec.start()
        running = True
        while running:
            i = input("请输入操作码:")
            if i == 's':
                running = False
                print("录音已停止")
                rec.stop()
                t = time.time() - begin
                print('录音时间为%ds' % t)
                # 以当前时间为关键字保存wav文件
                rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

调用pyaudio库录制以及播放wav音频文件

Pyaudio简介

PyAudio 是语音处理的 Python 库,提供了比较丰富的功能。

功能

python的Pyaud模块可以调用电脑的麦克风或音响进行录音,音频播放,生成wav文件等。

wave是录音是用的标准的WINDOWS文件格式,扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种。

Pyaudio安装

pip install pyaudio

使用Pyaudio进行录音

导入所需库

import wave
import pyaudio
def audio_record(out_file, rec_time):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16  # 16bit编码格式
    CHANNELS = 1  # 单声道
    RATE = 16000  # 16000采样频率
​
    p = pyaudio.PyAudio()
    # 创建音频流
    stream = p.open(format=FORMAT,  # 音频流wav格式
                    channels=CHANNELS,  # 单声道
                    rate=RATE,  # 采样率16000
                    input=True,
                    frames_per_buffer=CHUNK)
​
    print("开始录制。。。")
​
    frames = []  # 录制的音频流
    # 录制音频数据
    for i in range(0, int(RATE / CHUNK * rec_time)):
        data = stream.read(CHUNK)
        frames.append(data)
​
    # 录制完成
    stream.stop_stream()
    stream.close()
    p.terminate()
​
    print("完成。。。。。")

将它封装成函数,直接去调用,函数的参数分别为文件名称和录制时间。

使用Pyaudio库播放录音

import wave
import pyaudio
​
def play():
    chunk = 1024  
    wf = wave.open(r"文件名", 'rb')
    p = pyaudio.PyAudio()
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(),
                    rate=wf.getframerate(), output=True)
​
    data = wf.readframes(chunk)  # 读取数据
    print(data)
    while data != b'':  # 播放
        stream.write(data)
        data = wf.readframes(chunk)
        print('while循环中!')
        print(data)
    stream.stop_stream()  # 停止数据流
    stream.close()
    p.terminate()  # 关闭 PyAudio
play()