Git Product home page Git Product logo

speech-to-text-webcam-overlay's Issues

全画面表示モードを作る

ウインドウ全体にビデオが表示されて,コントロールとかが見えなくなるモードがあるといいかも

動作環境の追記依頼

次の環境でも動作しました。

ChromiumベースのEdgeは、さすがに(Googleに依存する)Speech Recognition APIが動きませんね。

画面の**に文字を寄せる機能

16:9ではないウインドウサイズで相手が会議に参加すると16:9の映像の両端がカットされてしまうため,文字が見えなくなることの対策

UDフォントの導入

名称は
font-family:"BIZ UDGothic";
です。よろしくお願いします。
(プルリクを送るほどでは無いものの Twitter だけだと忘れるので Issue で失礼します。)

UIをシンプルにする

デフォルトでは最低限のUIを表示しておいて,「Advanced Options」のような形で展開されるようにするとスッキリして良いかもしれない

時刻の記録にチェックを入れるとログにテキストが入らない

「認識結果のログ」の「時刻の記録」にチェックを入れると、認識結果のテキストがログのテキストエリアに入らないように見えます (日本語でも英語でも)。

以前は入っていましたが、7月9日に確認したのが最後で、久しぶりに試した 10月1日以降、入らなくなりました。
Chrome のバージョン : 94.0.4606.71(Official Build) (x86_64)(macOS 11.6)

素晴らしいページをありがとうございます。

ボタンデザインの改善

SS 2020-05-28 at 11 12 35

現状だと文字を読まなければならないため,アイコンつきでボタン化したい。
アイコン作成時は自作のもの(レポジトリをCC0で提供しているため)

名前(または愛称)をつけませんか。

今の状態だと「Speech to text webcam overlay」「1heisuzukiさんの字幕のやつ」となって長く、言及が微妙にしづらい状態です。何か名前か愛称があると呼びやすくなって良いのでは、と思いました。

適切な位置で改行する

単純な文字数での改行だと読みづらくなってしまうので,単語が切れないように改行すると読みやすいかもしれない。kuromoji.js等が活用できるかも

Safariでも利用可能にする

macOS の Safari と,iOS の Safari で WebSpeechAPIが利用可能になったとのこと。
https://caniuse.com/?search=Web%20Speech%20API

現在,Chorome 以外の場合は JavaScriptの処理が途中で exit するようになっているが,それを廃止するのを検討中。

軽く試した所,Safari では動作が重くなるような気がする。
また,現状の CSS だと Safari ではスライダーがうまく表示されていないので,そのバグ解消も同時に行いたい。

ショートカットキーで字幕をオンオフできるようにしたい

もともとスクロールしないと字幕オンオフのボタンに到達できず,ユーザーの画面サイズによっては画面をスクロールせざるを得ない状況だった。一旦,ボタン配置を変更して対応した。

ショートカットキーにする場合は,意図せずショートカットキーを押してしまったときの対策(字幕がオフですよと何か表示するとか?
)が必要かもしれない・

日本語以外の選択肢があったら

@1heisuzuki
素晴らしいシステムを開発していただき、ありがとうございます。
もし、音声認識には日本語以外の選択肢があったら、語学的な口頭練習にも役に立っているのではないかと思いますが、この機能を開発なさるご予定がございますか。

文字に輪郭を付ける

こちらでちょっと試してみたところ,少し文字の輪郭を付けると背景に影響されることが減る気がしました。もしよろしければお試しください(評価実験等の成果を反映した設定なのでしたら捨て置き下さい)。
-webkit-text-stroke: 1px #000;

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.