I'm not sure how a negative timestamp could have been generated, but I seem to have done it 😆 .
When I run whisperx "/mnt/d/Editing/Audiobooks/a7/a7.wav" --language Japanese --output_dir "/mnt/d/Editing/Audiobooks/a7/" --model large-v2 --vad_filter --align_model WAV2VEC2_ASR_LARGE_LV60K_960H --hf_token some_token
I get
~~ Transcribing VAD chunk: (06:11:47.932 --> 06:12:14.290) ~~
[00:00.000 --> 00:07.000] ヘビオーザ・ハークソンを貶めた 人間ども今は勝ち誇るがよいわ
[00:07.000 --> 00:16.960] 三年三年経てば時が満ちる その時こそ奴らは喜びの頂から
[00:16.960 --> 00:26.480] 絶望の谷底に落ちるであろうよ 頂が高いほどに谷は深くなり
~~ Transcribing VAD chunk: (06:12:17.902 --> 06:12:44.345) ~~
[00:00.000 --> 00:06.880] 小声が起ったその小声は地下深く から沸き起り地上に到達する前
[00:06.880 --> 00:13.840] に消滅して人間たちの耳に届く ことはなかったのである
[00:13.840 --> 00:21.400] パルス歴三百二十一年九月二日 のことであった
[00:21.400 --> 00:25.440] お楽しみいただけましたでしょうか このプログラムはオーディブル
[00:25.440 --> 00:28.280] お届けしました
Performing alignment...
Failed to align segment ("ザ・ハーク様の霜べたる身に与えられし術の一つだ。グールイラムツという、空気が蛇となって人に巻きつき、しめ殺すのよ。どうだ。お望みなら、汝の全身の骨を砕き、生きながら日常のクラゲとしてくれようか。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("ヒルメスはおどしにかかったが、いじゃくだとかでひんみんのようにやせこけたさいしょうは、ふるえあがるようなことはなかった。「いえ、はえて申し上げますが、ゆめごたんきをおこされますが、わたくしめがこうやってでんかのごぜんにしこういたしましたのは、でんかのおやくにたちたいからでございます。」お溜め御貸しを"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("すぐるとし、殿下の父をたるお方の身に何事が生じたか、わたくしめはよく存じ上げております。なかなかに世間の噂など、わたくしめの知るところに及ぶものではございません。わざとらしくフスラブが口を閉ざしたとき、ヒルメスの表情は完全に変っていた。無意識のうちに彼は足を組むのをやめ、玉座から半身を乗り出していた。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("何をする!サーム!殿下、こやつは最初フスラブ卿などではございません何?ヒルメスの視線を受けて最初フスラブは驚いた否、驚くふりを装ってマルズバーンに呼びかけたこれはしたりサーブ将軍!おぬしとは、窮地の中であるのになぜ、このような仕打ちをなさるのじゃ。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("ミルフェス王子よ、こやつの忠義面にだまされのがよいぞ。こやつは、さあ、ムーア、アンドラゴラス目に除任されて、マルズバーンの英職に尽きながら、いまではお主に仕えて新任されておる。偏説者じゃ。次はお主を捨てて、アンドラゴロスめのもとに帰産するかもしれぬぞ。信じてよいのかな?"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("すべては王とに入場してからだ。タハミーネよ、このことに関わったすべての人間が、傷口に塩水を浴びせられる時が近づいておる。同契約のルシタニア軍が退場しても、なかなかに喜劇の幕は下りぬわ。私にとっては喜劇ではございません。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("なんだ、今さらそんなことを言っておるのか。大大使殿下の御資質など、とうに俺は知っていたぞ。知ることと信じることは、別のものだと思うな。むろんそうだとも。たとえば、お主のある種の才能に対して、俺が知っていることと、お主が信じていることは、えらく差があるからな。言いたいことがあるなら、はっきり言ったらどうだ、ダーリューン。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("この時、アンドラゴラスの声はあまりに低く、ほとんどささやくようであった。父殺しではある。だが言っておくぞ。烈神だったのは、よより兄、オスロエスの方だった。それも当然のこと、兄は自分の気先を父王に奪われたのばかりだ。"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("おーい!エクバターナの衆!食べ物ならここにあるぞ!王太子アルスラン殿下のご命令でな!議論から運んできたのだ!さあみんな!思い切り食って!上を見出せ!"): no characters in this segment found in model dictionary, resorting to original...
Failed to align segment ("大したものだ。お太子殿下は一夜にしてエクバターナを掌握なさった。もはや何者も殿下の権勢を揺るがせることはできまい。まったく見事な乗っ取りだったな。ナラサス卿はバシルサンを出て10ヶ月で天下を乗っ取ってしまった。クバードが片目を細めて笑った。"): no characters in this segment found in model dictionary, resorting to original...
Traceback (most recent call last):
File "/home/ke/.pyenv/versions/subgen/bin/whisperx", line 8, in <module>
sys.exit(cli())
File "/home/ke/.pyenv/versions/3.9.9/envs/subgen/lib/python3.9/site-packages/whisperx/transcribe.py", line 723, in cli
write_vtt(result_aligned["segments"], file=vtt)
File "/home/ke/.pyenv/versions/3.9.9/envs/subgen/lib/python3.9/site-packages/whisperx/utils.py", line 59, in write_vtt
f"{format_timestamp(segment['start'])} --> {format_timestamp(segment['end'])}\n"
File "/home/ke/.pyenv/versions/3.9.9/envs/subgen/lib/python3.9/site-packages/whisperx/utils.py", line 34, in format_timestamp
assert seconds >= 0, "non-negative timestamp expected"
AssertionError: non-negative timestamp expected
I'm happy to share the 6 hour file for testing purposes on request. I tried breaking the audio into a small clip, and tested on #84, but unfortunately ended up with other errors.
I'm not sure how a negative timestamp could have been generated, but I seem to have done it 😆 .
When I run
whisperx "/mnt/d/Editing/Audiobooks/a7/a7.wav" --language Japanese --output_dir "/mnt/d/Editing/Audiobooks/a7/" --model large-v2 --vad_filter --align_model WAV2VEC2_ASR_LARGE_LV60K_960H --hf_token some_tokenI get
I'm happy to share the 6 hour file for testing purposes on request. I tried breaking the audio into a small clip, and tested on #84, but unfortunately ended up with other errors.