Some audio data urls:

URLs.AUDIOMDPI = 'https://zenodo.org/record/3562442'

URLs.MARCO = URLs.AUDIOMDPI # just a shorthand alias I'm more likely to remember

URLs.SIGNALTRAIN_LA2A_1_1 = 'https://zenodo.org/record/3824876'

URLs.SIGNALTRAIN_LA2A_REDUCED = 'http://hedges.belmont.edu/data/SignalTrain_LA2A_Reduced.tgz'

print(URLs.MARCO)
print(zenodo_url_to_data_url(URLs.MARCO))

https://zenodo.org/record/3562442
https://zenodo.org/api/files/d6589bb4-d6a6-4bc6-8e51-e6334fafbe3f/AudioMDPI.zip

print(URLs.SIGNALTRAIN_LA2A_1_1)
print(zenodo_url_to_data_url(URLs.SIGNALTRAIN_LA2A_1_1))

https://zenodo.org/record/3824876
https://zenodo.org/api/files/df302f12-7355-452e-93d1-b0c9344608f7/SignalTrain_LA2A_Dataset_1.1.tgz

Try downloading a sample .tgz file

path_st = get_audio_data(URLs.SIGNALTRAIN_LA2A_REDUCED)
path_st

Path('/home/shawley/.fastai/data/SignalTrain_LA2A_Reduced')

And try downloading from a Zenodo URL:

path_audiomdpi = get_audio_data(URLs.MARCO)
path_audiomdpi

Path('/home/shawley/.fastai/data/AudioMDPI')

Let's use this data as an example and take a look at it:

path_audiomdpi.ls()

(#4) [Path('/home/shawley/.fastai/data/AudioMDPI/LeslieWoofer'),Path('/home/shawley/.fastai/data/AudioMDPI/LeslieHorn'),Path('/home/shawley/.fastai/data/AudioMDPI/license.txt'),Path('/home/shawley/.fastai/data/AudioMDPI/6176ChannelStrip')]

We'll grab the LeslieHorn subset

horn = path_audiomdpi / "LeslieHorn"; horn.ls()

(#4) [Path('/home/shawley/.fastai/data/AudioMDPI/LeslieHorn/readme.txt'),Path('/home/shawley/.fastai/data/AudioMDPI/LeslieHorn/chorale'),Path('/home/shawley/.fastai/data/AudioMDPI/LeslieHorn/tremolo'),Path('/home/shawley/.fastai/data/AudioMDPI/LeslieHorn/dry')]

path_dry = horn /'dry'
#path_trem = horn / 'tremolo'
audio_extensions = ['.m3u', '.ram', '.au', '.snd', '.mp3','.wav']
fnames_dry = get_files(path_dry, extensions=audio_extensions)

waveform, sample_rate = torchaudio.load(fnames_dry[0])

Let's take a look at it:

show_audio(waveform, sample_rate)

Shape: (1, 110250), Dtype: torch.float32, Duration: 2.5 s
Max:  1.000,  Min: -0.973, Mean: -0.000, Std Dev:  0.086

show_audio(waveform, sample_rate, info=False, play=False, plots=['melspec'], ref=1)

Multichannel Concerns:

Let's make a multi-channel tensor and "show" it:

num_channels = 5
n = waveform.shape[-1]*3
waveform2 = torch.zeros((num_channels,n))
for c in range(num_channels):
    start = int(np.random.rand()*waveform.shape[-1]*(2))
    this_waveform, _ = torchaudio.load(fnames_dry[c])
    waveform2[c, start:start+waveform.shape[-1]] = this_waveform

show_audio(waveform2, sample_rate)

Shape: (5, 330750), Dtype: torch.float32, Duration: 7.5 s
Max:  1.000,  Min: -1.000, Mean: -0.000, Std Dev:  0.037

File handlers for multichannel files

e.g. converting between a multiple-mono-files representation (with individual tracks designated by "-(alphanumerics)" (aka "hyphen+stuff"):

Tests for that:

fn_list = ['input_21-0_.wav', 'input_21-1_.wav', 'input_21-hey_.wav', 'input_22_.wav', 'input_23_.wav', 'input_23-toms_.wav', 'input_24-0_.wav', 'input_24-kick_.wav']
print(fn_list)
track = fn_list[1]
print("getting matching tracks for ",track)
tracks  = get_accompanying_tracks(fn_list[1], fn_list, remove=True)
print("Accompanying tracks are: ",tracks)
print("new list = ",fn_list) # should have the extra 21- tracks removed.

['input_21-0_.wav', 'input_21-1_.wav', 'input_21-hey_.wav', 'input_22_.wav', 'input_23_.wav', 'input_23-toms_.wav', 'input_24-0_.wav', 'input_24-kick_.wav']
getting matching tracks for  input_21-1_.wav
Accompanying tracks are:  ['input_21-0_.wav', 'input_21-1_.wav', 'input_21-hey_.wav']
new list =  ['input_21-1_.wav', 'input_22_.wav', 'input_23_.wav', 'input_23-toms_.wav', 'input_24-0_.wav', 'input_24-kick_.wav']

fastproaudio core

`zenodo_url_to_data_url`[source]

`get_audio_data`[source]

`show_info`[source]

`plot_waveform`[source]

`plot_melspec`[source]

`play_audio`[source]

`show_audio`[source]

Multichannel Concerns:

File handlers for multichannel files

`get_accompanying_tracks`[source]

fastproaudio core

zenodo_url_to_data_url[source]

get_audio_data[source]

show_info[source]

plot_waveform[source]

plot_melspec[source]

play_audio[source]

show_audio[source]

Multichannel Concerns:

File handlers for multichannel files

get_accompanying_tracks[source]

`zenodo_url_to_data_url`[source]

`get_audio_data`[source]

`show_info`[source]

`plot_waveform`[source]

`plot_melspec`[source]

`play_audio`[source]

`show_audio`[source]

`get_accompanying_tracks`[source]