llm-jp / awesome-japanese-llm Goto Github PK
View Code? Open in Web Editor NEW日本語LLMまとめ - Overview of Japanese LLMs
Home Page: https://llm-jp.github.io/awesome-japanese-llm
License: Apache License 2.0
日本語LLMまとめ - Overview of Japanese LLMs
Home Page: https://llm-jp.github.io/awesome-japanese-llm
License: Apache License 2.0
コミュニティによる記事の改善を促進するため、リポジトリにコミットした人一覧であるContributorsを表示させたい。
https://github.com/BobAnkh/add-contributors を試したところ、README にはうまく表示されたが、Jekyll の設定により html タグがエスケープされてしまったため GitHub Pages には表示されなかった。
Jekyll をやめて他の静的サイトビルダーに乗り換えるところから検討する必要があるかもしれない。
あくまで @kaisugi が暫定で置いているもので、状況に応じて柔軟に変更します
現状は、エクセルシートから生成する仕組みになっているが、メンテナンスが大変。
matplotlibのコードから自動で生成できる仕組みにしたい。
are there multi modal LLMs (visual language)
Elyza task 100 も追加したい
https://huggingface.co/datasets/elyza/ELYZA-tasks-100
パラメータ数の図の縦軸に単位がつけれらていません。おそらく billion だと思いますが、追加した方がよいと思います。
@kaisugi さん、日本語LLMまとめページの作成ありがとうございます!
パラメタ数・公開時間の図に、rinnaモデルに関する情報の追加をお願いしたいと思いますが。
rinna早期モデルの代表として
こちらの情報は記事とcommit historyで確認できます。
パラメタ数・公開時間の図に追加してもらえば幸いです!
よろしくお願いします。
埋め込みモデルはLLMをfine-tuningしただけものが通例なのでこれまで掲載していなかったが、text-embedding-ada-002 のような埋め込みモデルの知名度が上がったこともあり、載せると需要がありそう。
https://github.com/oshizo/JapaneseEmbeddingEval にあるモデルのうち、日本語LLMベースのモデルを掲載する
LLama-v2 の件を見ると「オープンソース」という言い回しはやめた方が良さそうである。(そもそもこの記事の元々のタイトルは「フリーで使える日本語の主な大規模言語モデル(LLM)まとめ」だった)
公開されていて、誰でも試せる、というニュアンスの適切な表現に代替したい。
現在の図においては2022/07頃にプロットされていますが、NECのLLMに関するプレスリリースが出たのは2023/07頃なので1年分ずれているように見えます。
GitHub の Markdown 表示は横幅が狭く見づらいため、同内容を GitHub Pages として表示させたい
継続事前学習モデル がトレンドになりつつあるため。
もはや HuggingFace でモデルを使えることが当たり前になったため。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.