精选分类

课程笔记

投资日历

文章列表

10k9 分钟

# 文件系统概述 # 文件系统及其目标 信息是计算机系统中的重要资源,所有应用系统都需要存储和检索信息。操作系统的文件系统(File System)正是为了满足信息管理的需要而设计的,它负责信息的组织、存储和访问。 存储信息通常有三个基本要求: 大容量:能够存储大量的信息。 持久性:能够长期保存信息,即使系统断电也不会丢失。 可共享:允许多个进程或用户方便地共享信息。 为了满足这些要求,操作系统将信息以一种逻辑单元——即文件的形式,存储在磁盘等持久性存储介质上。文件系统作为操作系统中专门管理文件的部分,其核心目标是管理文件的存储、检索、更新,提供安全可靠的共享和保护手段,并为用户提供方便易
10k9 分钟

# 设备管理概述 # 设备管理的功能与目标 操作系统中的 I/O 子系统负责管理计算机的所有输入输出设备,是操作系统的核心功能之一。其主要功能和目标包括: 控制设备操作:按照用户的请求,控制设备的各种操作,完成 I/O 设备与内存之间的数据交换。 提供统一接口:在设备和系统的其他部分之间提供一个简单、统一且易于使用的接口,使用户能够方便地使用外部设备,摆脱繁琐的底层编程。 实现设备无关性(设备独立性):允许用户在编程时使用逻辑设备名,由操作系统负责实现从逻辑设备到物理设备的转换和映射。这意味着用户的程序可以独立于具体的物理设备运行。 提高处理效率:充分利用中断、DMA、缓
13k11 分钟

# 存储器管理概述 # 存储管理的挑战与起因 现代处理器能以很高的速度执行指令,因此处理器必须连接一个容量大、速度快的存储器。然而,设计一个足够大、足够快又足够便宜的单一存储器是不可能的。 容量问题:如果存储器容量太小,就不能装载足够的程序以保持处理器全力处理。 速度问题:如果存储器太慢,就不能像处理器执行指令那样快地提供指令和数据,导致处理器空等。 成本问题:大容量、高速度的存储器成本极其高昂。 # 存储器访问的局部性原理 操作系统和计算机体系结构通过利用“存储器访问的局部性原理”来解决上述挑战。该原理指出:处理器访问存储器时,无论取指令还是取数据,所访问的存储单元都趋向于聚集在一个较小
7.8k7 分钟

# 处理机调度 # 核心概念 # 调度的定义 在多道程序设计系统中,通常会有多个进程(或线程)竞争处理机资源。操作系统必须选择要运行的进程(或线程),并为其分配处理机。完成这一选择工作的操作系统代码称为调度程序(scheduler)。 # 调度的层次 长程调度 (作业调度) 也称为宏观调度或高级调度。它决定将哪些作业调入内存准备运行。其主要面向的是从外存后备队列中挑选作业。 时间尺度:通常是分钟、小时级别。 中程调度 (内存调度) 也称为中级调度。为了缓和内存紧张,它负责将暂时不能运行的进程从内存换出到外存,或在需要时将具备运行条件的进程从外存换入内存。这涉及到了内外存交换。
8k7 分钟

# 基本概念 # 进程的同步与互斥 # 进程同步 定义:指系统中多个需要相互合作以共同完成一项任务的进程,其执行次序需要通过协调来保证。这种协作进程之间相互等待对方消息或信号的协调关系即为进程同步。 产生原因:进程间的合作关系。 同步问题分类: 保证一组合作进程按照逻辑上要求的顺序执行。 保证合作进程在访问共享缓冲区(或共享数据)时能够协调一致。 # 进程互斥 定义:指若干进程在并发执行中,因竞争同一共享资源而产生的制约关系。任何时刻,最多只允许一个进程使用该资源,其他试图使用该资源的进程必须等待,直到资源被释放。 产生原因:对共享资源的竞争。 与同步的关系:互斥是一种特殊的同步关
4.2k4 分钟

# 线程的基本概念 # 引入线程的动机 引入进程的最初动机是为了使多个程序能够并发执行,从而提高资源利用率和系统吞吐量。进程具备两个基本属性,这也是其能够并发执行的基础: 资源分配单位: 每个进程拥有独立的虚拟地址空间,保存了进程映像(程序代码与数据),并能控制诸如文件、I/O 设备等资源。 CPU 调度单位: 进程是程序的一条执行轨迹。 然而,传统的进程模型存在一些挑战: 开销过大: 进程作为资源分配单位,其创建、终止和切换会带来较大的时间和空间开销。这限制了系统中并发进程的数量,也使得进程切换的频率不宜过高,从而制约了系统的并发程度。 多处理器系统挑战: 在多处理器(Mul
4.2k4 分钟

# 进程的概念与特征 # 程序的顺序执行与并发执行 # 程序的顺序执行 定义: 系统中只有一个程序在运行,该程序独占所有系统资源。 特点: 顺序性: 程序必须在前一个程序执行完成后才能开始执行。 封闭性: 程序独占资源,计算机状态完全由其控制逻辑决定。 可再现性: 初始条件相同,执行结果也相同。 # 程序的并发执行 定义: 在一定时间内,系统中有两个或两个以上程序都处于开始运行但尚未结束的状态,并且它们的执行次序不是事先确定的。 目的: 提高资源利用率,是目前主流操作系统的执行方式。 特点: 间断性(异步性): 程序“走走停停”,执行时序关系不再固定。 失去封闭性: 程序共享资源
2.3k2 分钟

# 预训练与微调 预训练(Pre-training) 为模型提供一个良好的初始参数估计。在这一阶段,模型通过海量数据学习通用的语言知识和模式。 微调(Fine-tuning) 则是在预训练的基础上,使用特定任务的数据集对模型进行进一步训练。若预训练效果良好,微调能更快地收敛到泛化能力强的局部最优解。 # 大语言模型(LLM)的代表性架构 BERT(Bidirectional Encoder Representations from Transformers) BERT 采用双向 Transformer 编码器。 核心训练任务是 Masked Language Model (Masked L
2.8k3 分钟

# Seq2Seq 概述 # 什么是 Seq2Seq? Seq2Seq(Sequence-to-Sequence) 是一种神经网络架构,用于将一个序列转换为另一个序列,常用于神经网络机器翻译(NMT)。 Seq2Seq 模型是条件语言模型(Conditional Language Model) 的应用。在翻译任务中,解码器在预测下一个单词时,其预测过程是基于源句子 xxx 的条件进行的。其概率计算公式为: P(y∣x)=∏t=1TyP(yt∣y<t,x)P(y | x) = \prod_{t=1}^{T_y} P(y_t | y_{<t},
3.9k4 分钟

# 自注意力机制(Self-Attention) # 基础原理 自注意力机制通过计算序列中不同位置之间的相似度(attention),来生成每个位置的加权表示。 查询、键和值(Query, Key, Value) 首先,对输入序列中的每个词向量 xix_ixi​,通过三个可学习的权重矩阵 WQ,WK,WVW^Q, W^K, W^VWQ,WK,WV 得到其对应的查询向量 qiq_iqi​、键向量 kik_iki​ 和值向量 viv_ivi​。 qi=WQxi,ki=WKxi,vi=WVxiq_i = W^Q x_i, \quad k_i =