Comments (5)
#19 和 #21 已经修复,我看了一下你改的,那样就匹配不到任何富文本了,附件也都没有。
其他的,我慢慢改吧,容我缓一下,尽量每天更新,以后再也不拖更了。
感谢这些天一直热心回答问题,进行 bug 的修复。辛苦了 (^o^)
from course-crawler.
你总算回来了:grinning:
那个#19和#21貌似是我疏忽了?刚刚看了眼正则就看出来有问题:joy:
剩下的你慢慢改吧,这段时间我先溜了:stuck_out_tongue_closed_eyes:
from course-crawler.
近期更新的平台实在太多……基本就是这一个月内吧,学堂在线全面改版,中M视频接口全面改m3u8(包括pc端新旧接口,以及移动端),连好多年没有变过的网易公开课都改新界面了,即便是不会花费太多时间,我也无力去为每一个去支持与测试了,当然我也是不想放弃的,有很多想法我还没有去做,但是实在是……精力有限……
其实,有些新技术的应用对于爬虫来说更加方便了,不需要慢慢去爬取 HTML 并解析了,相应地,对用户也是更加的友好了,所以,今后我建议还是直接在平台上观看吧~ 如果哪天我有需求,也许会再对我需求的某门课做下支持吧~
from course-crawler.
近期更新的平台实在太多……基本就是这一个月内吧,学堂在线全面改版,中M视频接口全面改m3u8(包括pc端新旧接口,以及移动端),连好多年没有变过的网易公开课都改新界面了,即便是不会花费太多时间,我也无力去为每一个去支持与测试了,当然我也是不想放弃的,有很多想法我还没有去做,但是实在是……精力有限……
其实,有些新技术的应用对于爬虫来说更加方便了,不需要慢慢去爬取 HTML 并解析了,相应地,对用户也是更加的友好了,所以,今后我建议还是直接在平台上观看吧~ 如果哪天我有需求,也许会再对我需求的某门课做下支持吧~
edX今年1月更新了策略,不付费,过期以后没法回看;新版学堂在线也设置了课程有效期;同时强力推荐各种费用不菲的认证证书项目,用高校的信用做背书(反正不是学历证书,想发多少发多少);高校MOOC过去一直是用爱发电,而现在微信公众号里各路神仙都在卖课,高校MOOC平台也需要盈利,所以感觉以后好的资源会越来越难以获得,唉
from course-crawler.
对于网易云课堂的付费课程倒不是很麻烦
在https://vod.study.163.com/eds/api/v1/vod/video
这个api的返回数据中
对k进行解密得到用于解密视频的aes key就行了。
k的解密方法也简单,这里提供一下算法:
k = "..."
k = list(base64.b64decode(k.encode()))
cipher = AES.new(b"3fp4xs922ouw5q72", AES.MODE_CBC, bytes(k[:16]))
k = cipher.decrypt(bytes(k[16:])).decode("utf-8")
aes_key = json.loads(k.strip())["k"]
update: 写快了,这个解出来是key的url,并不是解密视频的key,另外这个url只能访问一次。
from course-crawler.
Related Issues (20)
- **大学MOOC课程解析一半出错 HOT 4
- 添加新的网站支持 HOT 9
- 网易公开课抓取不完整 HOT 12
- **大学mooc的考研课程连接地址不行
- UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 9: illegal multibyte sequence HOT 1
- problem from links HOT 2
- 执行完毕后找不到课程文件夹
- 执行mooc.py报错 HOT 2
- 神也是粉丝
- Bug: 当网易云课堂 MOOC 的课程章节列表乱序时,下载的课件以及视频章节数错误 HOT 3
- 下载学堂在线课程,课程信息和字幕都有,但是视频的链接没有 HOT 2
- 程序运行出错 HOT 1
- 网易**大学MOOC视频格式变化了,下载不了了 HOT 11
- 好大学MOOC课程 没有视频下载地址等内容 HOT 2
- 程序运行报错 HOT 1
- 学堂在线无法下载视频
- 使用course-crawler如何只下载文档,不下载视频
- **大学MOOC下载报错 HOT 1
- 现在网易云课堂的还能下么。
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from course-crawler.