Git Product home page Git Product logo

cdn's People

Contributors

daniel011011 avatar

Watchers

 avatar

cdn's Issues

关于 Apple Vision Pro 的想法

Apple Vision Pro 叫做 Vision 。我想这表明了它的愿景是参与管理控制人类的视觉输入输出。

按照苏老师的说法,人类在信息上的终极需求是数码信息内容无缝与物理世界融合。即所谓的比特与原子的融合。目前视觉上我们几乎只能借助有限亮度色彩的平面屏幕从一个数码世界的切面里窥看到有限大小的,二维的内容。

AVP 则赋予了用户掌控自己视觉的能力。在无论虚实的任何环境。给予你任何内容在任何空间位播放的能力。

我们可以将对人的内容输入输出分为四点展开:数字内容的输入与输出,现实内容的输入与输出。

作为类比,听觉是人类第二大重要感官,这可以在耳机上联想到。四点论下,APP2这个形态与功能目前已经做到了对人类听觉输入输出不嵌入式情况下的大部分接管。分别是外界环境音输入,内部流媒体音频输入,数字麦克疯输出,只有一个你自己的声音输出没法控制。也就是你打电话他人会听见的问题,这或许需要脑科学的介入了。除此以外,APP2与赛博朋克中的听觉义体在效果上没有质上的区别了。

AVP 的对人现实的输入则是 see through ,通过摄像头获取然后极低延迟展示到屏幕上。对数字内容的输入是M2渲染的画面实时叠加在 see through 的画面上,只叠加一个窗口的大小是所谓 AR ,除了手臂叠加则是 VR 。现实的输出就是 eyesight 与 Persona 将你的被遮挡眼睛展示给聊天的对方。输出则依靠 Persona 在网络中展示。

类比一下 APP2 作为一个接管控制人类对听觉的设备,有以下几点与AVP相对照。

  • APP2 的噪音/自适应/通透控制以及不同环境声对应AVP Environment的比例与不同场景
  • APP2 的空间音频对应 AVP 的任何位置播放的能力。(当然在非空间计算设备上只会来自设备或者你的面前两种选择)
  • APP2 的降噪下的对话感知对应 AVP 的开启 Environment 后他人的模糊浮现
  • APP2 的麦克风一定程度上对应 Persona

对于苹果,讨论问题我往往有一个特别的角度,辅助功能。我想听觉的辅助功能能类比到视觉中。

听觉辅助功能里有在左侧,我类比的近似内容会在括号里

背景音(Environment)
对话增强(对话转文字,实时翻译?)
实时收听(放大镜?)
使用一只耳朵降噪(单眼使用AVP 或者单眼虹膜录入?)
声音持续识别(视觉识别?siri物品介绍与建议?现实版本大爆炸?)
自定义音频设置(自定义视觉设置?红绿色盲映射?纯色盲的颜色识别器?)

或许vision pro以后或者下一代能带给一些色盲,视觉障碍人士一些更多的帮助。譬如带着它出门,雷达与摄像头可以更好的识别环境告诉视力障碍人士。(现在 iPhone 放大镜已经有了)对于色盲患者,可以用覆盖式的图案表示不同东西的颜色或者红绿色盲也能选择合适的衣服搭配。或者当你看不清远处的字牌就放大给你看。用到翻译上,你可以实时看着一个被翻译过的世界,路牌菜单一切都直接翻译好了给你。与人对话直接显示字幕与翻译后的内容在他嘴边。

当然只是一些浅薄的想法

接下来想写的

  1. ESP32 的局域网开关电脑,并且接入米家
  2. HomeAssistant 的局域网开关机
  3. 好用软件整理
  4. 自己的日历订阅逻辑
  5. 苹果钱包的支持各类卡片归纳
  6. Apple TV ,infuse与Apple TV+ 体验报告
  7. 我心危的细节分析
  8. 规划一下 NAS 安装docker memes homeassistant rsshub

春节小记

春节,春节。寂静的城市,只有偶或的公交车和电瓶车驶过。

鸟鸣声不断,只有阳光洒在寂静的公园和一排排顾自倒数的红绿灯。

寂静的马路让鸟儿都大胆了起来,以至鸟鸣声都显得突兀起来,连绵不断,连绵不断。

有时在想,如果人类都消失了,鸟儿植物还有各种各样的东西还会生长运转,没有了汽车,没有了叫卖的声音,城市会变成什么样的?

干净的空气,阳光直直的射了下来,投射在草坪上,马路上,公园围墙上,映出干净清晰的轮廓。

仿佛除了鸟鸣没有其他东西在运动。静止,静止,一切都凝固了。#思考

总算是折腾好了 Azure TTS

我有听小说的习惯,特别是睡觉前听。而我又是一个对熟悉的声音有安全感的人,对微软 Azure 的 Xiaoxiao 抒情的 0.8 倍语速已经十分熟悉,也用它听了很多书。但由于种种原因不能用了。所以一直在找一种解决方法。要能满足超长文本的转语音并且挂载在播客上随时随地听。还要有实时TTS的方法。今晚睡不着姑且是研究透了。

1

获取 Azure 账号。 我选择购买闲鱼学生账号,大约20出头一个号,之前说是每月50w字符,又一说提升到每月500w字符。具体尚未去了解,有空证实后回来写。
理论上也可以自己办理一张visa卡。我也去工行办了一张星座大学生无额度的卡,但不知怎么,无法注册,可能是注册时填写地址名称等等错误,卡片被ban了。想来应该老老实实填写**地址?不太清楚。反正b站有详细教程需者自行查询吧。

2

登录后自行获取api,流程很简单,可以看看下面这个视频。这个作者有不少贡献和作用,后文会提到。

3

有了api和地区代码后,选择你想要的tts方式,是事先转化为音频还是直接在线听。先来讲前者。这边推荐两个项目,免费的是TTSVUE 收费的是 ZTJ-TTS。前者对超长文本,调整音频质量支持不太好。后者10元每月,也是上文B站视频的作者弄的。具体软件使用不细讲了。

4

想要在线听目前我只了解了安卓。使用阅读TTS sever。可以参考这个教程

5

上传播客。建议使用小宇宙或者网易云播客。注意,部分版权内容无法上传。不过我听得好像基本可以。具体法律风险不清楚。也可以考虑添加网易云云盘。个人习惯使用苹果生态的播客app订阅url。之前rsshub可以订阅网易云的播客。但ios17.4beta之后有bug,不下载不能听。所以转投小宇宙,小宇宙有个托管功能,开启后提供的rss订阅地址可以直接用苹果播客订阅,无需同步到苹果播客平台。

Matter 和米家的一些思考

是B站一位Matter区UP提到的,我就想了想几个点,先记录在这,后续有想法或者修正再更新

随便想到的一个点,目前matter的上手成本,比小米高。不提单件的价格,只是中枢的价格就贵不少。 homepodmini500,小爱音响play增强版(时间红外蓝牙网关音响四个功能)对于小米来说,廉价小爱音箱配合外观简洁,功能还行的各种配件。还是太强了的竞争力。比如买小米电风扇,或者电饭煲,配合小爱,很容易占据心智,下次路过商场的小米之家还能再逛逛。

在宣传上matter目前很难有触及用户的点,可能还是要看未来ov发力。 如果matter市场份额能影响到小米,我觉得应该是ov开始努力搞自家智能家居,联合各种小厂也好,自己做也好,反正整出来相对便宜线下展示的智能家居,然后卖类似音响的中枢产品。但感觉影响不会太强。

小米对待matter的态度我也没太想好,可能会在matter终于有点起色,产品丰富起来后,会有一个中枢,可能是中枢网关后续迭代产品,从而让matter设备都能显示在米家app里。至于会不会提供米家反向进入matter则不好说,要看ov盘子做的多大,小米具体负责人的考虑。(还有就是matter,homekit这种平台功能其实不那么多,还是要在米家里设置门锁开门者谁这种细节,所以米家就算开放并入matter压力也不大,自己app还是能留存,主要考虑小爱音箱的这个入口形产品的竞争压力)

不过也要考虑到小米做东西是有延后性的,做的很慢,才会出来。然后小米自己可能也会出matter的设备,同时支持米家,类似床头灯2这样的设备。

米家生态无论是在极客中还是普通消费者中,matter很长一段时间的影响都不会太强。

还有就是能对米家造成压力的还是得华为的下沉。国内iot讨论离不开手机,华为手机还有车子势头都很猛,如果鸿蒙iot搞更多照抄小米的产品和子品牌,然后用自己的影响力去传播。还是能抢占不少市场的。

不过目前华为应该还是巩固拓展自己的高端定制市场份额吧。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.