Git Product home page Git Product logo

Comments (4)

longmalongma avatar longmalongma commented on May 24, 2024

您好,仔细拜读了您的大作,有个问题还是没看明白想请教一下,请问随着迭代更新Reliable patch pool里面会保存所有过去帧的信息还是只保存第一帧和前一帧的信息?Reliable patch pool和基于stm的方法的momory read有什么区别?谢谢!

顺便再问一下,如何Update Reliable patch pool,是不断的把历史帧的特征逐渐加进去吗?

from rpcmvos.

JerryX1110 avatar JerryX1110 commented on May 24, 2024

感谢您的关注!

  1. reliable patch pool会保存历史帧中根据reliability筛选过后的信息
  2. patch pool本质上也是在构建一种memory,不过我们这里的构建方法以及使用方法和STM的方案不一致。我们的模型采用了基于可靠性度量来区别对待correction prior(比如第一帧的GT和 其他历史帧中的可靠信息)和propagation prior(比如前一帧prediction),而STM对所有的历史帧是同等对待的,容易产生error propagation的问题。
  3. reliable patch pool的更新方案,是每5帧update(添加)一次(这里follow了memory-based的一些方法的参数),可以看algorithm部分。具体地是说根据prediction uncertainty指标(这里采用的是shannon entropy)来把一些image-level feature patch retrieve到pool里,进一步用来算correlation和构建instance proxies。

我们在这里想提出的insight是: 对于video相关的一些任务,可以用历史帧中的可靠的信息来抑制误差传播。具体的implementation上,其实这个paper里的方案是比较naive的。在可靠性的定义和建模以及其他video相关任务的泛化性等方面,有待进一步完善和探索。也欢迎进一步交流~

from rpcmvos.

longmalongma avatar longmalongma commented on May 24, 2024

感谢您的关注!

  1. reliable patch pool会保存历史帧中根据reliability筛选过后的信息
  2. patch pool本质上也是在构建一种memory,不过我们这里的构建方法以及使用方法和STM的方案不一致。我们的模型采用了基于可靠性度量来区别对待correction prior(比如第一帧的GT和 其他历史帧中的可靠信息)和propagation prior(比如前一帧prediction),而STM对所有的历史帧是同等对待的,容易产生error propagation的问题。
  3. reliable patch pool的更新方案,是每5帧update(添加)一次(这里follow了memory-based的一些方法的参数),可以看algorithm部分。具体地是说根据prediction uncertainty指标(这里采用的是shannon entropy)来把一些image-level feature patch retrieve到pool里,进一步用来算correlation和构建instance proxies。

我们在这里想提出的insight是: 对于video相关的一些任务,可以用历史帧中的可靠的信息来抑制误差传播。具体的implementation上,其实这个paper里的方案是比较naive的。在可靠性的定义和建模以及其他video相关任务的泛化性等方面,有待进一步完善和探索。也欢迎进一步交流~

@JerryX1110 好的,明白了,非常感谢您详细的解释,感觉受益匪浅,我是中山大学一名博士生,研究方向就是VOS,我想进一步再深入研究您这篇大作,为了方便交流,能否添加一下您的微信。我的邮箱是:[email protected]。已whach 加 star。

from rpcmvos.

JerryX1110 avatar JerryX1110 commented on May 24, 2024

Okay, welcome!

from rpcmvos.

Related Issues (11)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.