Git Product home page Git Product logo

computer-vision-in-action's Introduction

    
    __  ___      _               _ ___    ____                             
   /  |/  /___ _(_)      _____  (_)   |  /  _/    _________  ____ ___      
  / /|_/ / __ `/ / | /| / / _ \/ / /| |  / /_____/ ___/ __ \/ __ `__ \     
 / /  / / /_/ / /| |/ |/ /  __/ / ___ |_/ /_____/ /__/ /_/ / / / / / /     
/_/  /_/\__,_/_/ |__/|__/\___/_/_/  |_/___/     \___/\____/_/ /_/ /_/      
    
    

Maiwei AI Lab - 迈微AI研习社

CircleCI

作者系迈微AI研习社创始人、CSDN博客专家,主要分享机器学习算法、计算机视觉等相关内容,每周研读顶会论文,持续关注前沿技术动态。公众号底部有菜单分类,关注我们,一起学习成长。


一种结合了代码、数据集和HTML的数字学习媒介


全面 前沿 免费

计算机视觉实战演练:算法与应用 📌
Computer Vision in Action

作者:张伟(Charmve)

GitHub CV-Action PyTorch jupyter 知识共享许可协议 Stars Forks

logo:maiwei

在线阅读(内容实时更新)

- 地址:https://charmve.github.io/computer-vision-in-action/

最新版PDF下载

- 地址:~~https://github.com/charmve/computer-vision-in-action/releases~~ (马上来 ...)

全书组织

🏷️ fig_book_org

book_org.png

全书详细思维导图

本书详细介绍,请移步 序言

  • 第一部分包括基础知识和预备知识。chap_introduction 提供深度学习的入门课程。然后在 chap_preliminaries 中,将快速向你介绍实践计算机视觉所需的前提条件,例如如何存储和处理数据,以及如何应用基于线性代数、微积分和概率基本概念的各种数值运算,涵盖了深度学习的最基本概念和技术,例如线性回归、多层感知机和正则化。

  • 第二部分是本书涉及的计算机视觉基础理论,核心部分为神经网络模型。包括神经网络、卷积神经网络、循环神经网络理论讲解,以图像分类、模型拟合与优化作为其代码的实战项目。在模型拟合和优化章节中,着重分享梯度下降、随机梯度下降、动量法、AdaBoost等方法。

  • 接下来的七章集中讨论现代计算机视觉技术实战。描述了计算机视觉的经典卷积神经网络PyTorch实现,并为我们随后实现更复杂的模型奠定了基础。接下来,在chap_cnnchap_modern_cnn 中,我们介绍了卷积神经网络(convolutional neural network,CNN),这是构成大多数现代计算机视觉系统骨干的强大工具。随后,在 chap_rnnchap_modern_rnn 中,我们引入了循环神经网络(recurrent neural network,RNN),这是一种利用数据中的时间或序列结构的模型,通常用于自然语言处理和时间序列预测,但在计算机视觉领域也表现出惊奇的效果。在chap_attention 中,我们介绍了一类新的模型,它采用了一种称为注意力机制的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将帮助你快速了解大多数现代计算机视觉应用背后的基本工具。

  • 该部分以项目为实战指导,给出详细的项目指导书和代码实现,更为特别的是,给出了notebook可以直接在线运行,跑通结果,免去了本地运行环境的搭建复杂性。于此同时,为了方便读者在本地调试,作者建立了一个名为 L0CV 的第三方包,可以直接在代码中 import L0CV 后使用。

  • 第三部分讨论最近几年出现的“网红”模型,诸如:Transformer、Attention、知识蒸馏、迁移学习、生成对抗模型等。这部分也是此份资料的力挺之作。首先,在 chap_optimization 中,我们讨论了用于训练深度学习模型的几种常用优化算法。

愿景

本开源项目代表了我们的一种尝试:我们将教给读者概念、背景知识和代码;我们将在同一个地方阐述剖析问题所需的批判性思维、解决问题所需的数学知识,以及实现解决方案所需的工程技能。

我们的目标是创建一个为实现以下目标的统一资源:

  1. 所有人均可在网上免费获取;
  2. 提供足够的技术深度,从而帮助读者实际成为计算机视觉应用科学家:既理解数学原理,又能够实现并不断改进方法;
  3. 包含可运行的代码,为读者展示如何在实际中解决问题。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验;
  4. 允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的计算机视觉领域;
  5. 由包含有关技术细节问答的论坛作为补充,使大家可以相互答疑并交换经验。

目录


- 更新中 ...

如何食用

🏷️sec_code

L0CV architecture

  1. Install
pip3 install -r requirements.txt
  1. Set up
python3 setup.py
  1. 按书中内容先后顺序逐章阅读,或者选取特定章节祥读 📁 docs/ 1,动手实践章节代码,在代码文件 📁 code/ 2 下找到对应代码,本地测试或者Colab 📁 notebooks/ 3 在线测试。

🔍 仓库文件浏览

  • 📁 L0CV/ - 专为本项目建立的 L0CV 包
  • 📁 code/ - 书中完整代码
  • 📁 datasets/ - 本书所用数据集
    • 📁 images/ - 经典图像处理图片
  • 📁 docs/ - 全书按照一下几个篇目进行编写
    • 📁 0_绪论/ - 全书绪论
    • 📁 1_理论篇/ - 基本理论和算法基础
    • 📁 2_实战篇/ - 项目实战教程
    • 📁 3_进阶篇/ - 最新CV模型和算法
    • 📁 附件/ - 所需数学和统计学知识
    • 📁 img/ - 各章节所使用的插图
  • 📁 models/ - 封装可用的预训练模型
  • 📁 notebooks/ - 全书 Colab notebook,可在线测试
    • 📁 chapter04_recurrent-neural-networks/ - 第 4 章 - 递归神经网络 Jupyter Notebook 实现
    • 📁 chapter05_graph-neural-network/ - 第 5 章 - 图神经网络 Jupyter Notebook 实现
    • 📁 chapter06_optimization/ - 第 6 章 - 模型拟合与优化算法 Jupyter Notebook 实现
    • 📁 chapter07_environment-setup-and-tool-use/ - 第 7 章 - 软件环境搭建与工具使用 Jupyter Notebook 实现
    • 📁 chapter08_convolutional-neural-networks/ - 第 8 章 - 经典神经网络架构:原理与PyTorch实现 Jupyter Notebook 实现
    • ...
    • 📄 01_Notebooks.ipynb - Notebooks 基本介绍和使用
    • 📄 02_Python.ipynb - Python 编程简明教程
    • 📄 03_NumPy.ipynb - NumPy 的使用
    • 📄 04_Pandas.ipynb - Pandas 的使用
    • ...
    • 📄 16_CVAE.ipynb - 卷积变分自编码器
    • 📄 17_TL-ants-bees-classification.ipynb - 迁移学习的应用:蚂蚁和蜜蜂的分类问题
  • 📁 docker/ - 为降低读者的学习成本,目前未进行搭建
  • 📁 res/ - ui 图片及全书思维导图PDF
  • 📄 README.md - 全书介绍及目录

常见问题

  • 在线教程页面无法打开

    测试中存在部分人打不开在线教程的情况。

    部分小伙伴反馈尝试切换浏览器后可以正常打开了,如果仍然不行,最有效的解决办法是科学上网。

  • 无法加载图片的解决办法

    根本解决办法还是科学上网,也可以尝试修改host文件看下是否能解决。

    windows解决方案:修改host文件

  • 公式无法正常显示解决办法

    GitHub中的Markdown原生是不支持LATEX公式显示的,如果你喜欢在本项目中直接浏览教程,可以安装Chrome的MathJax Plugin for Github插件让大部分公式正常显示。而docs文件夹已经利用docsify被部署到了GitHub Pages上,包含公式的章节强力建议使用 《计算机视觉实战演练:算法与应用》 在线阅读 进行学习。

    当然如果你还想跑一下运行相关代码的话还是得把本项目clone下来,然后运行code文件夹下相关代码。

  • Jupyter Notebook 无法在 GitHub 上呈现?使用 nbviewer

致谢

迈微AI研习社 Made With ML    异步社区    奇虎360

参考文献

--> Go to see REFERENCE.md,   感谢前人的杰出工作,我才得以写出此书。

关注我们

扫描下方二维码,然后回复关键词“计算机视觉实战教程”,即可加入“读者交流群”

迈微AI研习社是一个专注AI领域的开源组织,作者系CSDN博客专家,主要分享机器学习算法、计算机视觉等相关内容,每周研读顶会论文,持续关注前沿技术动态。底部有菜单分类,关注我们,一起学习成长。
  • 若本书里没有你想要理论和实战项目,或者你发现本书哪个地方有错误,请毫不犹豫地去本仓库的 Issues( 地址 https://github.com/charmve/computer-vision-in-action/issues )进行反馈,在对应版块提交你希望补充的内容或者勘误信息,作者通常会在 24 小时以内给您回复,超过 24 小时未回复的话可以邮件联系我(微信 MaiweiE_com);
  • 同时,我也欢迎大家加入本项目的建设中来,欢迎 pull request

LICENSE

知识共享许可协议
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。

CONTRIBUTION

作者会尽最大努力来确保书中内容的准确性,但难免会存在疏漏与不妥之处。欢迎您将发现的问题反馈给我们,帮助提升本开放资源的质量。

Help us make these docs great!

All VC-action docs are open source. See something that's wrong or unclear? Submit a pull request.

Make a contribution

Or, learn how to contribute.


Citation

Use this bibtex to cite this repository:

@misc{computer-vision-in-action,
  title={计算机视觉实战演练:算法与应用(Computer Vision in Action)},
  author={Charmve},
  year={2021.06},
  publisher={Github},
  journal={GitHub repository},
  howpublished={\url{https://github.com/Charmve/computer-vision-in-action}},
}

Stargazers Over Time

Stargazers over time


Feel free to ask any questions, open a PR if you feel something can be done differently!

🌟Star this repository🌟

Created by Charmve & maiwei.ai Community | Deployed on GitBook


* Update on Apr 29,2021 @Charmve, Star and Fork

computer-vision-in-action's People

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.