Git Product home page Git Product logo

hao's Introduction

好东西传送门

http://www.weibo.com/haoawesome

简介

好东西传送门 支持微博上的知识传播,集成微博好人好东西,帮您快速解决问题,为您精选专业知识

问答服务

  1. 微博用户 访问微博
  • 发一条微博提问,里面加上 @好东西传送门
  • 发私信给 好东西传送门
  1. github用户:

订阅服务

  1. 订阅微信公众号: 好东西传送门 (发送好东西传送门的一些推荐和<机器学习日报>)

  1. 订阅好东西周报 (邮件列表,每周的问答与资源推荐合集,大约每周五发)

使用许可

本站内容许可证:Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License Creative Commons License

问答与传送档案

最新的内容请看好东西周报 http://haoweekly.memect.com/ , 每周更新

2014-11以前的内容看 存档

hao's People

Contributors

baojie avatar haoawesome avatar lidingpku avatar memect avatar nahgnaw avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

hao's Issues

@血色又残阳 需要语音处理的资料

1、论文最好有配套代码,可以跑一下对比效果;
2、当前学术界和工业界最新或者主流技术有哪些;
3、是否有跟深度学习结合的;
4、最好也有说话人鉴别的相关论文和代码。

@破破的桥 代人求教一个文本识别方面的问题。

极客杨的OCR工具箱:Tesseract 是目前应用最广泛的免费开源OCR工具(背后有Google的支持)。商业产品有ABBYY的finereader,还有Adobe;国产的有文通和汉王。除了常规电脑的应用,Tesseract也被移植到智能手机上。资料卡片流: http://hao.memect.com/?tag=ocr-tools

@好东西传送门 代人求教一个文本识别方面的问题。比如对下图这类中文文字、英文文字、数字混排的文本,传统的文本识别软件效果非常差。不知道有没有合适的低成本的方法将这类图片转成文本文件,并且保证一定的识别率(比如90%)?假如这其中还夹杂着非文字的照片呢?
http://www.weibo.com/1459358890/BgFoRwPgG

http://ww4.sinaimg.cn/bmiddle/56fc0caagw1ej06diuyz2j20b90m0afi.jpg

@我爱机器学习 . 判断两张图片是否是同一内容(只考虑光照、倾斜、模糊、偏移等因素)的资料有否?最好有算法和代码。2. 图搜图的较好开源代码和paper有哪些?

@好东西传送门 做的不错哈,试问两个问题:1. 判断两张图片是否是同一内容(只考虑光照、倾斜、模糊、偏移等因素)的资料有否?最好有算法和代码。2. 图搜图的较好开源代码和paper有哪些?

http://m.weibo.cn/5066241201/3739054010734322?sourceType=sms&from=1044195010&wm=4260_0001

@猴山寨主找夫人 请问是否能提供一个入门级的大数据指导方案

整理稿: https://github.com/memect/hao/blob/master/awesome/learn-big-data.md

基本思路:大数据是一个内涵非常广泛的概念,以前称为统计,数据科学,机器学习,数据挖掘,分布式数据库,分布式计算,存储,可视化等等诸多领域的方法均可列入大数据的范畴.更详细的领域列表可以见Github上的Awesome Big Data

https://github.com/onurakpolat/awesome-bigdata

大多数大数据技术其实对于普通的个人和中小企业并不需要全部涉猎.学习大数据技术前最好先有"小数据"(内存和单机硬盘就能解决的数据)处理经验.盲目上大数据技术不仅浪费学习时间,也会不必要地提高后期运营成本.最好是从业务出发,逐步提升.

核心最重要的一些技术网上一些课程,如coursera和小象学院都有提供.这里我们列一个极简版,面向的是以Excel为基础,目的是解决普通数据处理任务(也就是,不是Google,淘宝那样大规模)的用户.

第0级:Excel和简单图表

第1级:关系数据库和SQL语言,如Access和MySQL ,了解最基础的数据库知识

第2级:学一点基础的编程,推荐Python/R,Java也可以,最基本的知识就可以

第3级:学会在程序中访问数据库,做一些结合业务的分析

第4级:如果有速度,容量的要求,学一个NoSQL数据库,比如redis,mongodb,neo4j,elasticsearch.不需要都学,根据业务需要选择一个常用的就可以了.

第5级:学一点数据分析常识,如线性回归,多项式拟合,逻辑回归,KNN聚类,决策树,Naive贝叶斯等.Python/R/Java都有现成实现

第6级:如果有变态的容量,计算要求,学如何使用云计算平台,如亚马逊的EC2, S3

第7级:如果有变态的分析要求,了解一点Hadoop和MapReduce的原理,然后用一个现成的实现,如Amazon Elastic MapReduce (Amazon EMR)

第8级:如果有更变态的分析要求,学一点spark或任何一个SQL on Hadoop.

这时候恭喜你,在任何一个"大数据群"都可以指点江山了.

@TechCrunch** 国际创新北京峰会VIP票大pk

目前还有十多条未完成问题,欢迎各位专家帮忙认领回答!8月5日前转发最多的两条答案将获赠 @techcrunch** 国际创新北京峰会双日VIP票,本来3200一张哦!

会议详情 http://tc.technode.com/

这样认领问题:去Github Issue列表下面 http://t.cn/RPI5jaZ 找一个感兴趣的问题,回复你想分享的资源链接,也可附简单评语。请留下你的微博帐号(或其他联系方式),好东西传送门会整理后贴出你的答案并注明贡献者是你

也可以推荐一个话题给@好东西传送门,在github上建一个issue或在微博上留言都可以。请推荐一组网络资源并加简短导读(一条微博长度)。

wechat:泡泡龙: 我想知道query意图分析(query分类)有哪些方法?

问:wechat:泡泡龙: 我想知道query意图分析(query分类)有哪些方法?
答:搜索关键词: query意图分析 ,query intent,query classification,user intent。 2009 年的一个综述(有幻灯片)。淘宝搜索Query的15个类型;本地搜索(微软专家);图像搜索(雅虎专家)。卡片合集:http://hao.memect.com/?tag=query-intent

链接合集: https://github.com/memect/hao/blob/master/awesome/query-intent.md

@维尔茨:你好,请问有木有关于循环神经网络在segmented sequence labeling方面的papers么?我希望用RNN label sequence本身而非sequence members

@维尔茨 问: 有木有关于循环神经网络在segmented sequence labeling方面的papers么?我希望用RNN label sequence本身而非sequence members
答: 多伦多大学的 Alex Graves 有专著研究此问题. 基于recurrent neural networks(RNN)研究: @ICT_朱亚东 推荐Herbert Jaeger的短教程(40多页). Jürgen Schmidhuber教授收集了60多相关论文, 微软研究院利用RNN做自然语言处理

http://memect.co/bq5V7dz

http://bigdata.memect.com/wp-content/uploads/2014/08/wzEaPva7nKOI0894srRlMkLk6OTLTIZQWe73eLYjM1E7K8v9xPMCintGu5IYBJYh_97fe6f196546d966c05706ecdf7da0ca8ee8d5d96c1b170d9c00de3690895a50.jpeg

http://bigdata.memect.com/wp-content/uploads/2014/08/KGP1s1R6yt3d9aaOT6Bhuk8xkWOmpLFA5edB7YOgGak1X6uN6GxotZiteg3Zsy0f_38319d2ed3620a648189652f46511476a1c5cb6677ac4adf0d6a81d40814fe76-300x300.jpeg

http://bigdata.memect.com/wp-content/uploads/2014/08/content-300x300.jpg

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.