为减少存储体积,图片会通过压缩算法优化。JPEG格式通过离散余弦变换DCT保留视觉重要信息,再用霍夫曼编码将高频冗余数据转化为更短的01序列;而PNG则采用损压缩,通过LZW算法消除重复像素数据,确保图片放大后不失真。论是哪种格式,最终存储的仍是经过编码的01位流,码时计算机按规则还原像素矩阵,屏幕便显示出图像。
从0和1到声音:波动的数字化采样 声音是空气振动产生的波,具有连续的频率和振幅。要让计算机“听懂”声音,需先通过采样和量化将模拟声波转化为数字信号。采样即按固定时间间隔记录波的振幅如CD标准采样率为44.1kHz,即每秒采样44100次,量化则将振幅值转换为二进制数如16位位深,可表示65536个振幅等级。一个16位、44.1kHz的音频样本,每秒会产生44100×2=88200字节的01数据。原始音频数据体积庞大,压缩格式如MP3通过“心理声学模型”优化:过滤人耳法感知的高频噪音和掩蔽效应,保留关键频段,再用MDCT变换和霍夫曼编码将数据压缩。播放时,计算机读取01位流,经码还原为数字振幅序列,通过数模转换器DAC转化为电压信号,驱动扬声器振动,最终还原声音。
从0和1到视频:动态图像与声音的同步交响 视频是“动态图片+同步音频”的组合。计算机存储视频时,先将连续画面分为独立的“帧”如每秒24帧的电影,每帧按图片编码规则转化为01数据;同时,音频按上述声音编码方式处理。为避免数据量爆炸,视频压缩算法如H.264、MPEG-4会消除冗余:通过I帧关键帧记录整画面,P帧预测帧仅存储与前一帧的差异,B帧双向预测帧参考前后帧数据,配合运动补偿技术,大幅减少重复信息。播放时,计算机会同步码视频帧和音频流,通过时间戳PTS确保画面与声音对齐。每帧图像按像素规则渲染,音频转化为模拟信号,最终在屏幕和扬声器上呈现出流畅的动态影像。
论是静态的图片、流动的声音,还是连贯的视频,本质都是0和1按特定规则排列的“数字密码”。计算机通过编码将现实世界的信号转化为二进制,再通过码还原为感官可感知的媒体——这便是数字时代最基础的“魔法”。
