Comments (8)
同僚がこれを見て、大容量のGPUをつんだwndows10で試したいとせがまれました。
すでにanacondaはinstallされていますが、今回のStyleGANを動させるのに不足なmoduleを特定できませんでした。
可能であれば、何が必要なのか教えていただけませんか。
google colaboratory上で作成したrequirement.txtを添付しますので、そちらをご確認ください。
requirement.txt
保存されるmodelですが、学習が完了するまですべてを保存する必要はないと考えてますが、正しいでしょうか。
fileサイズがかなり大きいので、defaultの4倍の間隔でも大変です。
今の所、学習を途中でとめる時点でのmodelのみを保存し、それ以前は消去します。
ただし学習が最終段階に近づいた時点で、保存間隔を狭め、modelも残していく予定です。
このやり方で大丈夫でしょうか。
良いと思います
私はFIDが良い値になった場合のモデルファイルだけを残していました。
今回のcodeを用いて、他のdata-setを試す事は可能でしょうか。
我々は工業材料の電子顕微鏡の画像を扱っており、対象は人ではなく、画像もgray-scaleです。
もし修正したほうが良い所があればご指摘くださると助かります。
gray scaleではない画像は試された方がいるようで、それについては動作したようです。
確かCelebAというdatasetだったかと思います。
gray scaleは想定していないので、改修は非常に難しくなると思います。
group convやupsampling時にbilinearを独自実装(NVIDIAが)したりしているので、それらに対して辻褄を合わせるのは至難の技だと思います。
from gan_sample.
h-s-dev 様
回答ありがとうございます。
最後の回答について質問させてください。
今回のモデルはRBGの人の画像を対象にしておりますが、人以外のRGB画像は難しいということでしょうか。
from gan_sample.
今回のモデルはRBGの人の画像を対象にしておりますが、人以外のRGB画像は難しいということでしょうか。
論文では人以外にも部屋の写真、車の写真などを生成しているようなので、人だけではないかと思います。
実際のところ、試してみないと分からないとは思いますが。
私は業務で人以外の物体についてStyleGAN2で生成を行いました。
生成画像はわりと良い感じになったと思います。
StyleGAN2で生成した画像を組み込み、semantic segmentationの学習を行ったところ多少精度が上がりました。
下記がStyleGAN2の論文になります。
こちらもご参考にされると良いかと思います。
https://arxiv.org/pdf/1912.04958.pdf
from gan_sample.
h-s-dev 様
ありがとうございます。
こちらでも試してみます。
from gan_sample.
半日ほどfidが表示さず、質問を書いていましたところ、つい先程回復しました。
なぜでしょう?
logが大きいと読み込みに時間がかかるのでしょうか。
ですので、以下途中経過になります。
手元のPCで動作させて6日ほど立ちました(4/7 夜開始)。
昨晩、原因不明でprogramがfreezeしてしまいました。
キーボードも受け付けてくれませんでした (tmuxを使ってますが、まさかそれが原因?)。
やむえずPCを再起動して、再度programを動作させました。
4日ほど立った時点でfidが最小になって、再び上昇しました。
fidが悪くなったにもかかわらず、画像の質は向上しているようでした。
現在も画質は向上してますが、悪くなるときもあるようです。
画像サイズが128x128pxですので、ぼちぼち限界でしょうか。
生成される画像の質が良くなってきていますが、顔や体がやや歪です。
水着の色や形はリアリティが高く、感心しています。
このような画像が手元のPCでも容易に生成できるように、programを作成されましたh-s-dev 様に感謝します。
from gan_sample.
半日ほどfidが表示さず、質問を書いていましたところ、つい先程回復しました。
なぜでしょう?
logが大きいと読み込みに時間がかかるのでしょうか。
fidの計算はofficialの実装でV100を使用してもかなり時間がかかります。
あとは私の移植が最適化されていないために遅い可能性があります。
こう直したほうが良いなどの改善点がありましたら、コードを修正しpull requestを上げてください。
画像サイズが128x128pxですので、ぼちぼち限界でしょうか。
128 × 128の場合は情報量が少ないので、私が試した時も良い精度の画像を生成することは難しかったです。
256 × 256でも今ひとつの精度だったので、最終的には512 × 512の画像を使用しました。
Google Colabo proを5回線ほど契約し、V100が出るまでGPUガちゃを毎日行い、3ヶ月ほど色々試してようやく生成したのが、サンプルコードのトップに掲載している画像になります。
from gan_sample.
h-s-dev様
回答ありがとうございます。
あの結果を出すのは大変な仕事量ですね。
こちらも先程まで動かしていましたが、128px では限界のようですので、やめることにしました。
programについては読み切れていませんが、参考になることがあればご連絡します。
他の人の参考までにtensorboardと画像を貼り付けておきます。
128x128で約9日稼働後の結果です。
3回に分けたので、同じグラフが3つあります。
各グラフの最後がfidです。
ここまでの画像を見ていると、顔や腕の表現が難しいようです。
胸や体幹、水着(模様は微妙)、背景は自然な感じがします。
波長が長い構造は容易だが、短いものは難しい?
当然か。。。
from gan_sample.
ここまでの画像を見ていると、顔や腕の表現が難しいようです。
胸や体幹、水着(模様は微妙)、背景は自然な感じがします。
波長が長い構造は容易だが、短いものは難しい?
当然か。。。
顔は細かいので難易度は高いですが、512で学習を頑張るとある程度は見れる感じになると思います。
顔と体がそれなりに見れるようになっても最後は手や指が綺麗に生成されないことが多いです。
データ数は2万件ぐらいですが、augmentationを行っているので元のデータ数は2000件ほどです。
もしかしたら元のバリエーションが足りないのかもしれません。
サイズ512をGoogle colaboで学習するとバッチ数が4と少なくなってしまうので、もしかしたらそれが原因かもしれません。
良い画像が生成できたら、またご連絡ください。
from gan_sample.
Related Issues (16)
- esrganでgray-scale画像の高解像度化は可能でしょうか HOT 15
- EfficientGANをgary-scaleで試してますが、画像が不鮮明で_img_from_Zの画像のコントラストが低い HOT 37
- 3D-α-WGAN-GPの応用について HOT 7
- RuntimeError occurred during training HOT 8
- コード内のVariable()について HOT 4
- style_gan2_pytorch/simple_upfirdn_2d.pyについて HOT 1
- photo2portraitデータセットにアクセスできません HOT 3
- section6_3_recycleGAN_pytorch_face.ipynbのReplayBufferが誤っている? HOT 1
- AnoGAN Fruits-360 dataset をダウンロードできない? HOT 4
- 出力の名称について HOT 3
- section7_1-training.ipynb のエラーについて HOT 7
- Updating: gan_sample/chapter7/requirements.txt HOT 1
- section5_1_pix2pixのGのGAN学習コード HOT 2
- 電子書籍 HOT 4
- Windows 10における実行時のエラー "BrokenPipeError: [Errno 32] Broken pipe" HOT 4
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from gan_sample.