600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > Python 提取音乐频谱并可视化

Python 提取音乐频谱并可视化

时间:2022-03-03 03:15:00

相关推荐

Python 提取音乐频谱并可视化

你有没有经常好奇一些音乐软件的频谱特效是怎么做的,为什么做的这么好看?有没有想试试自己提取音乐频谱并可视化展现出来?今天,咱就结合上次的音乐剪辑操作:

Python 剪辑音乐就是这么简单

来可视化下面这首歌曲的频谱!

1.准备工作

开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,请访问这篇文章:超详细Python安装指南 进行安装。

Windows环境下打开Cmd(开始—运行—CMD),苹果系统环境下请打开Terminal(command+空格输入Terminal),准备开始输入命令安装依赖。

当然,我更推荐大家用VSCode编辑器,把本文代码Copy下来,在编辑器下方的终端装依赖模块,多舒服的一件事啊:Python 编程的最好搭档—VSCode 详细指南。

输入以下命令安装本文所需要的依赖模块:

pip install pydubpip install librosa

看到 Successfully installed xxx 则说明安装成功。

2.频谱展示

使用librosa和matplot,我们可以用10行代码完整地展示整个频谱:

import matplotlib.pyplot as pltimport librosa.display# 音乐文件载入audio_path = 'Fenn.mp3'music, sr = librosa.load(audio_path)# 宽高比为14:5的图plt.figure(figsize=(14, 5))librosa.display.waveplot(music, sr=sr)# 显示图plt.show()

不过,这样的频谱是整段音乐的,看起来非常难看,接下来我们使用 pydub 切割频谱,以获得更佳的效果。我们细分到0到1秒的区段来查看频谱:

import matplotlib.pyplot as pltimport librosa.displayimport numpy as npfrom pydub import AudioSegment# 1秒=1000毫秒SECOND = 1000# 音乐文件AUDIO_PATH = 'Fenn.mp3'def split_music(begin, end, filepath):# 导入音乐song = AudioSegment.from_mp3(filepath)# 取begin秒到end秒间的片段song = song[begin*SECOND: end*SECOND]# 存储为临时文件做备份temp_path = 'backup/'+filepathsong.export(temp_path)return temp_pathmusic, sr = librosa.load(split_music(0, 1, AUDIO_PATH))# 宽高比为14:5的图plt.figure(figsize=(14, 5))librosa.display.waveplot(music, sr=sr)plt.show()

这下细是细了,但是还是太复杂了,其实我们做频谱的展示,只需要正值即可:

然后我们还可以进一步放大,比如说0.9秒到1秒之间的频谱:

放大

n0 = 9000

n1 = 10000

music = np.array([mic for mic in music if mic > 0])

plt.figure(figsize=(14, 5))

plt.plot(music[n0:n1])

plt.grid()

显示图

plt.show()

这样好看许多,不过如果要达成QQ音乐那种效果,还是需要进行大量改造。

比如用精美的图像元素来填充替代、然后零值如何处理?如何让频谱更加平稳?此外,我们是静态的图像,还需要根据事件动态地延续波段。

用于生产的代码肯定比我们这简易的代码更加复杂,而且也不应该是暴力去除负值绘制图像。这些有兴趣的读者可以自行研究啦。

我们的文章到此就结束啦,如果你希望我们今天的Python 实战教程,请持续关注我们,如果对你有帮助,麻烦在下面点一个赞/在看哦,有任何问题都可以在下方留言区留言,我们都会耐心解答的!

Python实用宝典

不只是一个宝典

欢迎关注公众号:Python实用宝典

原文来自Python实用宝典:Python 提取音乐频谱并可视化

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。