tf.contrib.signal.stft返回一个空matrix

这是我运行的代码片段：

import tensorflow as tf sess = tf.InteractiveSession() filename = 'song.mp3' # 30 second mp3 file SAMPLES_PER_SEC = 44100 audio_binary = tf.read_file(filename) pcm = tf.contrib.ffmpeg.decode_audio(audio_binary, file_format='mp3', samples_per_second=SAMPLES_PER_SEC, channel_count = 1) stft = tf.contrib.signal.stft(pcm, frame_length=1024, frame_step=512, fft_length=1024) sess.close()

由于print(pcm.eval().shape)返回，所以mp3文件被正确解码：

 (1323119, 1)

当我使用print(pcm.eval()[1000:1010])时，甚至有一些实际的非零值：

 [[ 0.18793298] [ 0.16214484] [ 0.16022217] [ 0.15918455] [ 0.16428113] [ 0.19858395] [ 0.22861415] [ 0.2347789 ] [ 0.22684409] [ 0.20728172]]

但由于某些原因， print(stft.eval().shape)计算结果为：

 (1323119, 0, 513) # why the zero dimension?

因此print(stft.eval())是：

[]

据此， tf.contrib.signal.stft输出的第二个维度等于帧数。为什么没有框架呢？

看来， tf.contrib.ffmpeg.decode_audio返回一个形状(?, 1)的张量，这是一个信号? 样本。

然而tf.contrib.signal.stft需要一个(signal_count, samples)张量作为input，因此必须预先转置它。

像这样修改调用的窍门是：

 stft = tf.contrib.signal.stft(tf.transpose(pcm), frame_length=1024, frame_step=512, fft_length=1024)

tf.contrib.signal.stft返回一个空matrix

如何将主机设备挂载到Docker容器中的主机？

如何运行Docker来监听特定的端口以与Jenkins集成

如何将文件夹从Dockerfile复制到Docker镜像？

Gitlab-ci服务configuration

docker-compose：执行数据库脚本

mysql不会以大日志文件启动

我怎样才能得到“docker – 组成规模”使用最新的形象创build的任何额外的实例？

如何运行与docker的jekyll撰写获取 – 服务的不支持的configuration选项：“网站”

如何build立一个运行MySQL的Docker容器？

如何在Postgres Dockerfile中正确设置VOLUME和CMD指令？