![]() ![]() |
![]() |
|
![]() |
||
![]() |
2025-06-05
OuteTTSでテキストの音声化を試す
OuteTTSというののv1.0が出てたので試してみました。
前回のブログ内の文章を適当に読ませてみました。
風邪ひいてるときに読んだマンガ - きしだのHatena
「勇者」「美女」を読めなかったり「平和」が「ピンフ」になったりするので、書き換えています。あと、英語女性話者のプロファイルしかないので、英語訛りになってますね。
OuteTTSというT2Sモデルを試すけど、日本語の読み上げは微妙・・・
なんか以前のバージョンにあった日本語話者プロファイルとかがなくて、英語女性話者しかない。 pic.twitter.com/PT6b0mlcta
— きしだൠ(K1S) (@kis) 2025年6月5日
ということで、「勇者を暗殺するために・・・」の一文を読み上げて食わせてみたら、なんか訛りが入りつつそれっぽく話しています。
なんか適当によみあげた音声を食わせて話させてみたら、なんか変ななまりありつつ、それっぽく話している。 pic.twitter.com/8ZhCcZEjko
— きしだൠ(K1S) (@kis) 2025年6月5日
gradioとoutettsが必要です。
pip install gradio outetts
import gradio as gr import tempfile import os from outetts import Interface, ModelConfig, GenerationConfig, Backend, InterfaceVersion, Models, GenerationType from outetts import LlamaCppQuantization
interface = Interface(
ModelConfig.auto_config(
model=Models.VERSION_1_0_SIZE_1B, # backend=Backend.HF, backend=Backend.LLAMACPP,
quantization=LlamaCppQuantization.Q4_K_S,
)
)
speaker = interface.load_default_speaker("EN-FEMALE-1-NEUTRAL") # speaker = interface.create_speaker("yusha.wav") # interface.save_speaker(speaker, "yusha.json") # speaker = interface.load_speaker("yusha.json") def text_to_speech(text):
output = interface.generate(
GenerationConfig(
text= text,
speaker=speaker,
)
) with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as fp:
output.save(fp.name) return fp.name # Gradioインターフェース iface = gr.Interface(
fn=text_to_speech,
inputs=gr.Textbox(label="テキストを入力"),
outputs=gr.Audio(label="生成された音声"),
title="OuteTTS",
description="テキストを入力すると音声(WAV)を生成して再生します" )
iface.launch()
音声言語処理入門: 図解・音声・動画でわかる
作者:高良 富夫
研究社
Amazon
nowokay 2025-06-05 11:37 読者になる
もっと読む
コメントを書く
OuteTTSでテキストの音声化を試す
ブログを開設した年のグループに入りましょう
はてなブログには、同じ話題でつながる「グループ」があります。まずはブログを開設した年のグループに入りましょう。同時期に始めたブログとつながることができます。
「2025年開設ブログ」のグループ
taediumの日記
読者になる
現場のためのソフトウェア開発プロセス - たかのり日記
読者になる
設計と実装の狭間で。
読者になる
Rustでブロッキングキューを実装する
▼ ▶
2013
2013 / 12
▼ ▶
2012
2012 / 12
▼ ▶
2011
2011 / 12
2011 / 8
2011 / 7
2011 / 6
2011 / 3
2011 / 1
▼ ▶
2010
2010 / 8
2010 / 7
2010 / 6
2010 / 5
2010 / 3
2010 / 2
▼ ▶
2009
2009 / 12
2009 / 9
2009 / 7
2009 / 6
2009 / 4
2009 / 3
2009 / 2
▼ ▶
2008
2008 / 12
2008 / 10
2008 / 8
2008 / 4
2008 / 3
2008 / 2
2008 / 1
▼ ▶
2007
2007 / 12
2007 / 11
2007 / 10
2007 / 7
2007 / 6
2007 / 5
2007 / 4
2007 / 3
2007 / 2
2007 / 1
▼ ▶
2006
2006 / 12
2006 / 11
2006 / 10
2006 / 9
2006 / 8
2006 / 7
2006 / 6
2006 / 5
2006 / 4
2006 / 3
2006 / 2
2006 / 1
▼ ▶
2005
2005 / 12
2005 / 11
2005 / 10
2005 / 9
2005 / 8
2005 / 7
2005 / 6
2005 / 5
2005 / 4
2005 / 3
2005 / 2
2005 / 1
▼ ▶
2004
2004 / 12
2004 / 11
2004 / 10
2004 / 9
2004 / 8
2004 / 7
Error 404--Not Found
From RFC 2068 Hypertext Transfer Protocol -- HTTP/1.1:
10.4.5 404 Not Found
The server has not found anything matching the Request-URI. No indication is given of whether the condition is temporary or permanent.
If the server does not wish to make this information available to the client, the status code 403 (Forbidden) can be used instead. The 410 (Gone) status code SHOULD be used if the server knows, through some internally configurable mechanism, that an old resource is permanently unavailable and has no forwarding address.
Error 404--Not Found
From RFC 2068 Hypertext Transfer Protocol -- HTTP/1.1:
10.4.5 404 Not Found
The server has not found anything matching the Request-URI. No indication is given of whether the condition is temporary or permanent.
If the server does not wish to make this information available to the client, the status code 403 (Forbidden) can be used instead. The 410 (Gone) status code SHOULD be used if the server knows, through some internally configurable mechanism, that an old resource is permanently unavailable and has no forwarding address.
月の生活 | よなよなエール公式ウェブサイト「よなよなの里」
読者になる
FAQ / お問い合わせ窓口
海外POSシステム開発エンジニア募集 by 株式会社Abby
現在、大規模チェーンレストラン向けのレストラン店舗運営システムを開発しています。展開先はアメリカ、オーストラリア、台湾、マレーシア、...
www.wantedly.com
Unityでスマホ、Switchのゲーム開発をしたいエンジニアを募集! by 株式会社Abby
今回は、・Unityを使用したNintendo Switch向けのゲーム開発・Unityを使用したスマートフォン向けのゲーム開発...
www.wantedly.com
2016-09-20
Seasar Conference Final
今週の土曜、9/24にSeasar Conference Finalを行います。
10年前に始まったSeasar Conferenceもいよいよ今度でFinalです。
お申し込みはこちら。
http://seasar.connpass.com/event/38679/
Seasar Projectの面白かったところって、開発方法論が盛り上がったところだと思うんですよ。
マーチンファウラーをはじめとして、著名な人たちのほとんどが「ドメインモデル推し」の中、僕は、「ステートレスなサービス + DTO推し」だったからね。S2Daoは、このために作ったようなものです。
あの開発方法論の議論に、かなりの人が参加したり、自分で考えたりしたでしょう。それが、面白かったところです。みんなが自分の事として考えたから。そんな難しい話ではないし、自分のプロジェクトに即いかせる話だしね。
オブジェクト指向ナンチャラとかDDDとか、素晴らしいものなんだけど、自分のプロジェクトで生かそうとするとそう簡単にはいかないからね。
Seasar2の開発が終了した事で、Seasar Projectに関わった多くの人たちの多くの時間が無駄にされたと、思っている人もいるようだけど、僕はそうは思わない。Seasar Projectに関わった事で、プログラマとしての能力や知名度をあげた人とって多い訳だから、それを否定する必要はないと思っています。
今度のSeasar Conferenceでは、「Seasar Projectのふりかえり」と「SXSW攻略法」の二つの話をします。
「Seasar Projectのふりかえり」では、昔話をしてもしょうがないので、いくつかのプロジェクトを「なぜ始めたのか」「うまくいったところとでその理由」「失敗したところとその理由」を話す事で、これから、新しくプロジェクトを立ち上げる人向けに、少しでも役に立つ話が出来ればと思います。
「SXSW攻略法」では、2016年のSXSWで、RealeaseItというアワードでファイナリストに残る事が出来たので、ファイナリストに残るためのこつ、そしてアワードをとれなかった理由。また、SXSWでは、ブースも出したので、ブースを出すときのポイントを話したいと思います。
Seasar Conference Finalお申し込みはこちらです。
http://seasar.connpass.com/event/38679/
■015.004.008
[ EVENT ] 4月8日 Java Day Tokyo 2015 開催!
http://www.oracle.co.jp/jdt2015/
[ BROWSER ] Firefoxのページめくりを加速さ-http://journal.mycom.co.jp/news/2010/02/02/007/index.html
アーカイブ
2009年3月
2008年12月
2008年11月
2008年10月
2008年9月
連載を終了したブログ
コアテクの路地
路地裏 ソース解読研究所
みたのブログ
拓かれた世界に向かって
ペンギン飼育係が見た
ユメのチカラ
独立行政法人情報処理推進機構へ出向になりました。
3月1日付けで独立行政法人情報処理推進機構(IPA)へ出向になりました。オープンソフトウェア・センター研究員を拝命し、本日より同機構へ出勤しています。ミラクル・リナックス時代は大変お世話になり厚く御礼を申し上げます。IPAでも変らづご厚情お願いいたします。略儀ながらおしらせまで。
さて、ミラクル・リナックスからの出向ではありますが、オープンソースソフトウェアや勉強会あるいは若手人材育成(セキュリティ&プログラミングキャンプ、U-20プログラミングコンテスト)などなどにつきましては、今迄どおり、ゆるゆると推進していきたいと思います。皆様のご協力をよろしくお願いいたします。
そして、カーネル読書会も従前どおりやりますので、そちらの方もよろしくお願いいたします。
本日は久々にスーツ&ネクタイ、コスプレでした。(がはは)
Forbidden
You don’t have permission to access /~asaki/p_diary/diary.cgi on this server.
■ Google、「Chromium OS」を公開
http://www.publickey.jp/blog/09/chrome_os.html
■ シャットダウンも日本語入力もできない?
http://blog.livedoor.jp/dankogai/archives/51325262.html
■ Chronium OSのコンパイル手順
http://d.hatena.ne.jp/showyou/20091120/1258687525
■ IBM developerWorks:Scitter(ScalaのTwitterクライアントライブラリ)を使ってTwitterを更新する
http://www.ibm.com/developerworks/jp/java/library/j-scala10209.html
■ IBM developerWorks:Web アプリケーションのセキュリティー: 脆弱性をテストする(WebScarab、Paros Proxyの紹介)
http://www.ibm.com/developerworks/jp/web/library/wa-appsecurity/
■ IE用のJavaScriptパフォーマンス分析ツール「dynaTrace AJAX Edition」
http://journal.mycom.co.jp/news/2009/11/20/017/index.html
■ YouTube:Lisp for High-Performance Transaction Processing
http://www.youtube.com/watch?v=xquJvmHF3S8-■ ブラウザ上で世界中のAM・FMラジオ、ネットラジオが無料で聴けるサイト「Streema」