数据处理细节讨论

Question

你好，我看你论文提到使用了Movi数据集，原始的Movi数据集只提供了3d以及AMASS通过fitting得到的关于SMPL-H的mesh参数。SMPL-H关于shape有

Arthur151 · Answer

2D pose estimation分支的训练主要是在预训练阶段进行的，对模型最后的性能（尤其是泛化性）影响很大，还是需要使用一些比较有挑战的2D pose数据集来强化模型

Arthur151 · Answer

Sorry, I haven't managed to project the posed mesh back to 2D image too.
I have ta

zhLawliet · Answer

ok，thanks

zhLawliet · Answer

你好，请问下，movi，hm3.6这些数据在训练的时候，是否做了背景增强？如果做了，他们的人像mask是通过某个开源人像分割模型得到的吗

zhLawliet · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Arthur151 · Answer

我训练的时候没有用背景增强。我的训练数据集主要是Human3.6M, MPI-INF-3DHP, MSCOCO, MPII, LSP, UP, AI Challenger(

zhLawliet · Answer

好的，谢谢，那像 MPI-INF-3DHP这种只有2d，3d标签的数据集，你会自己去fitting出SMPL系数作为gt吗？

Arthur151 · Answer

我是直接用的关节点监督的。fit的感觉形状很怪。

zhLawliet · Answer

嗯，谢谢，我确认一下，所以2d数据集，就只能用于重投影监督loss，有2d和3d的数据集，就只监督重投影监督loss和3dloss，有SMPL系数的数据集，则都会进行监督；

Arthur151 · Answer

肯定有啊，需要去调整的。主要还是看数据能贡献出来的训练价值和模型每个阶段的学习状态。

zhLawliet · Answer

好的，非常感谢了

zhLawliet · Answer

你好，想确认一下，hm3.6数据集你是怎么使用的，只是使用了他的3d点和基于相机参数投影得到的2d点吗？我看有的工作会fitting出SMPL系数进行监督。

Arthur151 · Answer

hm3.6数据集可以通过MoSh算法求得ＳＭＰＬ参数，用于训练。

zhLawliet · Answer

好的，非常感谢

zhLawliet · Answer

你好，有几个问题请教一下：
问题1：hm3.6这里可以理解有两个3d标签，一个是hm3.6数据集本身提供了3d点，，另外一个是通过其smpl系数导入SMPL得到的3

Arthur151 · Answer

１．我还没观察过经相机投影矩阵处理过后的h36m的３Ｄ关键点数据是否和ｓｍｐｌ参数转化的３Ｄ点有尺度偏差，如果有图的化我也方便判断是什么问题。
２．监督３Ｄ关节点误

zhLawliet · Answer

好的，谢谢，关于”相机投影矩阵处理过后的h36m的３Ｄ关键点数据是否和ｓｍｐｌ参数转化的３Ｄ点有尺度偏差“，我后面整理一下图像和数据发出来。

from romp.

zhLawliet · Answer

您好，我目前尝试复现你的开源模型效果，在训练的时候，
相关loss设置如下：
e_center_loss_weight: 500.
e_2d_los

zhLawliet · Answer

好的，谢谢你的答复

zhLawliet · Answer

你好，请问下，你谈到训练tricks上是有一些，不知道方便说一下吗？目前我按照你前面谈到的，先训练好2D pose estimation，然后基于它进行fintune训练，

Arthur151 · Answer

你目前测试３ＤＰＷ上是多少啊？训了多久？

zhLawliet · Answer

我这边计算的MPJPE 和 MPJPE_PA 分别是105.21和77.22。目前用到的总的训练样本数为48.6w（主要是Human3.6M, MPI-INF-3DHP,

Arthur151 · Answer

你这还是在3DPW上fine-tunned了的结果啊。。。那这也太离谱了，你确定你的代码fine-tune我开源的模型没掉点么？
这绝对不是什么trick的问题了。

zhLawliet · Answer

嗯，有一点忘记说了，我在finetune的时候，将输入改成了128*224了，可视化效果看着差异不大（从pj2d loss的角度上看的话，
0.0009涨到0.00

Arthur151 · Answer

这种输入大小我还真没试过。。而且点掉这么多。。感觉可能训练是有点问题的。

zhLawliet · Answer

好的，谢谢，我再看看，争取先到50

Arthur151 · Answer

加油。我还在等一个月后的结果，希望可以尽早开源所有代码。

Arthur151 · Answer

训练代码已开源～

zhLawliet · Answer

好的，谢谢

littlejiumi · Answer

想问一下作者h36m标签中kp3d_mono和kp3d有什么区别呀？实际用的是哪个呢？

Arthur151 · Answer

我们在<a href="https://github.com/Arthur151/ROMP/blob/87e80901acbe8dd40bf975a5da010a0cd33

littlejiumi · Answer

谢谢您的回复！还请问一下h36m的poses为什么是[3,72]维度的？想得到smpl的24个3d点怎么转换呢？

Arthur151 · Answer

h36m是视频数据，我们每5帧取一下标注，但其实它的gt给的还是挺高频的，还提供了中间帧周围的gt，我就一起保存了，如果只用中间帧，就选1就好了。
建议看一下我代码

littlejiumi · Answer

哈哈好嘞～

yunshangyue71 · Answer

想请问一下作者，hm36以及mupo-3dph数据集的关节点怎么匹配呢？比如我想使用两个数据集进行训练，即便是同一个joint， neck 每个数据集的标注也不是相同的，这

Arthur151 · Answer

您说的很对，现在确实有这个问题，所以导致模型的训练也会有点受这个影响，目前，还是直接默认他们是一个关键点。但最近的有篇文章，可能对您有帮助：
Learning 3D

yunshangyue71 · Answer

多谢您的回复，我参考看一下。另外有三个问题像请教一下，麻烦您了1、model based 和sekelton based的选择我想驱动一个

数据处理细节讨论 about romp HOT 37 CLOSED

Comments (37)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent