2024年9月20日

为什么计算力不够,计算力到底是什么,计算的本质是在做什么? 有人说,计算的本质是研究有限状态(熵)的转移的规律。 能不能有大神来深入解释一下。 我先抛…

。01背后是芯片,芯片背后是计算,计算背后是0和1跳动,0和1跳动背后是电子跳动。这个是科学角度,回归常识,计算,就是想对客观世界,多了解一点,是对哲学的补充

,矩阵式键盘的控制芯片,有个按键和电位变化对应表,按下某些键,根据表查出是哪些个按键被按下了,就可以告诉电脑啦

,拿机械硬盘举例来说,无刷电机控制、磁头动作、温度检测、逻辑地址与实际扇区分配、接口协议,都是主控芯片搞定的

,对于4K液晶屏,共有3840*2160=8294400个像素点,每个像素点256个亮度级(电压),所以一帧画面需要同时控制2123366400个电压值,看这个数字,就很离谱

,路由算法能够确定去往目的网络的最佳路径,也就是将聊天信息数据从你的主机转移到小姐姐的主机

,这个事情就更复杂了,声纳、5G、Wifi、广播、卫星、地震波、图像压缩、视频压缩等,核心算法就是FFT,Fast Fourier Transform,傅里叶变换,据说,如果FFT被更早的证明,可能就不会存在呢

渲染,《昆塔》制造最高峰时动用了阿里云6100余台服务器,用到了15万个小时处理器核心和400TB的内存,累计计算时间超过1000万小时。《阿凡达》当时动用了40000颗CPU,104TB内存,10G网络带宽,整整离线个多月。所以,渲染的计算量,可想而知了吧!

。GPT3,训练一次,需要798张NAVIDA A100 GPU(指的是配置,当然可复用),每天推理所需算力,大约是2195张NAVIDA A100 GPU。还需要考虑并行训练、测试、模型存储等用卡量,总体按10000块A100估计。显卡(NVIDIA 80GB A100 GPU)的租赁价格为 1.5 刀每小时。10000块A100一天的租赁费用:10000 * 24 * 1.5 = 36万刀。

额外说一句,各家大模型处于参数量军备竞赛中,但token训练数也是一个很重要的参量,因为,token是英文单词和中文汉字的基本组成。大模型看样子在预测单词,本质上是在预测token。1000 token ≈ 750英文单词

,Apple Vision Pro,不就是空间计算么,不就是把一个电脑戴在头上了么,不就是靠手/眼/声音就可以操控了么,不能说了不起,简直就TM伟大。苹果凭借一己之力,引领世界从个人计算和移动计算,进入空间计算

,一列火车是北京到广州的高铁票,但是有人买了石家庄到长沙的,这样就会出现北京到石家庄和长沙到广州的两张余票,然后有人买了

来看看鼠标工作原理,如何通过拖动鼠标去控制光标在屏幕上的位置移动的。现在常规鼠标都是光电鼠标,这个光一般就是二极管光、激光或蓝光。

拿二极管光电鼠标来说。在光电鼠标内部有一个发光二极管,通过该发光二极管发出的光线,照亮光电鼠标底部表面(这就是为什么鼠标底部总会发光的原因)。然后将光电鼠标底部表面反射回的一部分光线,经过一组光学透镜,传输到一个光感应器件(图像传感器)内成像。这颗有着1600个像素的图像传感器只关心鼠标正下方占大概一硬币1/1200大小的区域。然而关键是,图像传感器每秒能拍17000张底下平面的图片,因此,就算你将鼠标在鼠标垫上移动了仅0.1秒,在此期间,图像传感器还是能拍1700张图片。

这样,当光电鼠标移动时,其移动轨迹便会被记录为一组高速拍摄的连贯图像。最后利用光电鼠标内部的一块专用图像分析芯片(DSP,即数字微处理器)对移动轨迹上摄取的一系列图像进行分析处理,通过对这些图像上特征点位置的变化进行分析,来判断鼠标的移动方向和移动距离,从而完成光标的定位。

这项技术绝就绝在,鼠标不会保存任何图片,事实上,每次拍完一张图片后,它会拿新图片跟59微秒前拍摄的旧图片进行对比,鼠标芯片将根据两张图片的区别来判断在X轴跟Y轴上的变化。这本质上就是,在1/17000秒或者59微秒后,你把鼠标向什么方向挪了多远。

同样的,键盘中有个控制芯片,矩阵式键盘的控制芯片,有个按键和电位变化对应表,按下某些键,根据表查出是哪些个按键被按下了,就可以告诉电脑啦!

电脑键盘的工作原理是基于电路原理和物理原理的。当用户按下键盘上的一个按键时,按键会被机械地按下,并触发键盘底部的一个开关。这个开关被按下后会连接一个电路,通过电路传输信号到计算机,告诉计算机哪个按键被按下了。

在键盘的底部,有一个叫做键轴的机械部件,它与键帽相连。当用户按下键帽时,键轴会向下移动,触发开关,从而将信号发送给计算机。开关的类型可以是机械式的,也可以是薄膜式的,但两种类型的基本工作原理都是相似的。

电脑键盘的底层原理是使用二进制编码来传输数据。每个按键都对应着一个二进制编码,并通过计算机的输入设备接口传输给计算机。在现代键盘中,常用的编码协议是USB和PS/2。

总的来说,电脑键盘的工作原理是通过机械按键触发开关来产生二进制编码的信号,从而告诉计算机用户按下了哪个按键。

移动硬盘中有芯片,这个就更不必多说了吧!拿机械硬盘举例来说,无刷电机控制,磁头动作,温度检测,逻辑地址与实际扇区分配,接口协议,都是主控芯片搞定的。

来看看1602A,可能是最古老的液晶屏了,不过直到现在,它还是很受欢迎,打印机、计算器啥的,那它是怎么把文字显示在屏幕上的呢?

1602是这么来的,横着16个区域,竖着2个区域,所以1602。每个区域横着5个像素,竖着7个像素,所以整个屏幕就是16 * 2 * 5 * 7 = 1120个像素。通过芯片控制这1120个像素,就可以控制屏幕上显示的字符啦!

上面1602A只控制经典的黑白两色,其他各种显示屏幕包括彩色液晶屏,基本原理都差不多,但复杂度要高很多。1602A的显示芯片只需要控制1120个像素即可,每个像素2个电平,所以主要控制2240个电平开关,对于4K液晶屏,共有3840*2160=8294400个像素点,每个像素点256个亮度级(电压),所以一帧画面需要同时控制2123366400个电压值,看这个数字,就很离谱,但得益于半导体行业高速发展,这个水平的4K液晶电视,5000左右软妹币搞定(尺寸大价格高),CPU8GB,显卡4GB,也就差不多了吧!

泛泛来讲,网络层在计算机网络中承担的主要功能是:将数据从一台主机移动到另外一台主机。详细一点说,网络层的主要功能是:路由和转发。

简单的说,当你在聊天窗口按下“发送”按钮后,你的聊天数据被应用层打包成数据包,经过运输层向路由器运送,而路由器会将数据包中包含地址信息解析出来,交给路由转发表处理,路由转发表就能够确定数据包在本路由器如何转发分组。

这就涉及到我们今天的主角:路由算法。路由算法能够确定去往目的网络的最佳路径,而转发表则能够确定数据包在本路由器如何转发分组。

为了方便处理,我们一般将网络抽象为图。其中,路由器为图中的结点,网络链路抽象为图中的边,链路长度则为图中的权值。不用说,有计算,就有芯片。下面这个路由节点很少,最短路径也很容易算出来,可是,互联网很大啊,路径很多啊,计算就很复杂啊!

信号处理这个事情,就更复杂了,上班路上你听的广播,AM和FM,分别是幅值调制和频率调制的意思。信号处理中,声纳、5G、Wifi、广播、卫星、地震波检测等,图像压缩、视频压缩等,核心算法就是FFT,Fast Fourier Transform,傅里叶变换,直接上一个硬核科普视频,据说,如果FFT被更早的证明,可能就不会存在呢!

渲染是怎么回事,本质是什么?既然动画、电影、游戏都是渲染大户,咱们就从这些应用场景着看!

想想《阿凡达》这个动画是怎么来的。思考逻辑是这样的,动画是屏幕显示出来的,屏幕显示本质是一帧帧图片依次播放(人视觉暂留是0.1~0.4秒,只要帧速大于这个速度,比如30FPS,每两帧之间是1/29秒=0.03秒,图片播放就成了视频了),图片本质是像素。所以,下面这个场景中的人和动物,本质上都是像素,可是问题又来了,为啥看上去这么逼真呢,这就是渲染的功劳。

本质上,渲染是由场景数据生成二维图像的过程。这里说的场景数据包含了我们渲染场景时需要的所有信息,包括物体几何、视点、纹理、光照、材质等等。这些都属于场景数据的范畴。这里的二维图像可以理解为像素矩阵。

具体做法就是,使用3D建模软件先建模,之后把3D模型转化成2D图片,在图片上面添加位图纹理或者程序纹理、照明、凸凹纹理映射以及相对于物体的位置(这就是渲染),将这些图像在动画制作程序中将它们链接在一起,得到的结果就是消费者或者观察者所能看到的完整图像(把渲染好的2D图片连接在一起快速播放,就成了动画、电影和游戏)。

《昆塔》是中国第一步原创3D动画片,每一帧图片的渲染耗时,根据模型复杂度不同,差异很大——模型越复杂,渲染时间越长。有人做过这样的计算:按照渲染一帧(一层)的平均耗时为2小时,2K~4K的分辨率,片长160分钟,每分钟9000帧图片(60秒*30帧*5层)计算,整部电影的渲染时间长达288万小时。

《昆塔》制造最高峰时动用了阿里云6100余台服务器,用到了15万个小时处理器核心和400TB的内存,累计计算时间超过1000万小时。

上面数字很可怕是不是,不过还是没直观感受,那我们算一算钱。综合上面的访问和训练用A100数量:2195+798 = 2993,还需要考虑并行训练、测试等用卡量,总体按10000块A100估计。显卡(NVIDIA 80GB A100 GPU)的租赁价格为 1.5 刀每小时。10000块A100一天的租赁费用:10000 * 24 * 1.5 = 36万刀。

控制:语音,双手,按钮交互:眼球追踪,面部追踪,手势控制,键鼠操作支持身临其境的娱乐体验支持使用AR查看支持通话会议

5个传感器:1个LiDAR,2颗深度相机,2组未知传感器(位于外壳上方中间区域)12颗摄像头:2组RGB主相机,4组下视角相(2组近乎垂直向下,2组斜向下),2组外侧视角相机,4组眼球追踪红外相机(头显内测)头显外侧底部2组红外光传感器

外壳:一块独特的三维成型夹具玻璃流入铝合金框架中,该框架弯曲以包裹脸部光印:Light Seal轻轻弯曲以贴合脸部,提供精确贴合,同时阻挡杂散光头巾:头带提供缓冲、透气性和弹性

看完参数就啥也不想说了,不就是空间计算么,不就是把一个电脑戴在头上了么,不就是靠手/眼/声音就可以操控了么,不能说了不起,简直就TM伟大啊!

网购一个产品,对你来说,主要行为大概是:选品,添加购物车,选地址,提交订单,支付,对应用来说(淘宝、天猫、京东、拼多多)来说,过程中需要记住你的每一个点击数据,好对你进行画像,画像数据提交给推荐算法。

推荐错不重要,但你花了钱,过程中任何一个数据不能有任何错误,否则就乱套了。中间所发生的计算,是我们无法直接想象的,可以从间接角度——计算耗电量,来体会下计算量有多大。

2020年,阿里云38万台服务器全年耗电4亿度电,腾讯云10万台服务器全年耗电1.44亿度电,Google 90万台服务器全年用电量22.6亿度电。这些都是什么概念呢,来看看阿里巴巴煮蛋史,哈哈!

12306,出一张票,需要数千个PV(Page View,页面浏览量或点击量,用户每次刷新即被计算一次),春运10亿人每人一张票,就是10^11个PV,可问题没这么简单啊,火车票的购票心理是——求之不得,梦寐以求。买到票的人也不一定满意现在的车次、时间。总之,就是一个字:刷!刷!刷!

火车票跟很多票(包括淘宝天猫的商品、机票、体育场馆门票等)有不一样的属性。比如,从北京到广州,沿途有多个站点,理论上乘客可以选择任意 一段区间购票,所以每买一张

一列火车是北京到广州的高铁票,但是有人买了石家庄到长沙的,这样就会出现北京到石家庄和长沙到广州的两张余票,然后有人买了

计算本质是0和1,点击鼠标、敲击键盘、发送消息、听到广播、玩一个游戏、听一首歌……..,所有所有这些,背后都是芯片,芯片背后都是计算,计算背后都是0和1在跳动,0和1跳动背后都是电子(人类已知61 种基本粒子目前唯一玩得转,其实也不是很玩得转,即使近似理论范畴内,电子的行为仍然没法精确计算,到了1nm这个级别,量子效应就很明显了,都知道,量子理论目前还很不清楚)的跳动,看看下面视频,也许你会明白一点!

发表评论

邮箱地址不会被公开。 必填项已用*标注