多核架构的并行程序设计技术

更新时间:2023-10-13 19:25:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

五邑大学研究生考试

高级程序设计课程

2014~2015年度 第1学期

多核架构的并行程序设计技术

院系: 计算机学院 学号: 2111405001 姓名: 周帅

任课教师: 白明 成绩评定:

多核架构的并行程序设计技术

1 多线程的概念

线程(thread)是进程上下文(contex)中执行的代码序列,又被称为轻量级进程(light weight process),是操作系统中比进程更小的可执行单元。在支持多线程的系统中,进程成为资源分配和保护的实体,而线程是被调度执行的基本单元。进程的资源包括进程的地址空间,打开的文件和I/O等资源。属于同一个进程的线程共享该进程的代码段和数据段,打开的文件,信号等。除了共享资源,每个线程还包含各自的线程ID,线程执行状态,CPU寄存器状态和栈。

多线程机制的优点包括以下几个方面:

1.创建一个线程比创建一个进程的代价要小。由于线程共享进程的资源,所以进程被创建时不需要再分配内存空间等资源,因而创建线程所需的时间也更少。2.线程的切换比进程间的切换代价小。线程作为执行单元,当从同一进程的一个线程切换到另一线程时,需要载入的信息比进程切换时要少,所以切换速度更快。3.充分利用多处理器。同一进程的线程可以在多个处理器并行运行,该进程的运行速度可以显著提高,而单线程的进程却只能在一个处理器上运行,不能充分利用多个处理器。4.数据共享。对于同一进程的线程来说,他们共享同一块地址空间,可以访问相同的数据。数据共享使得线程之间的通信比进程间的通信更高效,更容易。5.快速响应特性。对于交互程序来说,多线程设计的优势是,当执行一些耗时或者可能被阻塞的操作时,其他部分仍然保持运行和响应。另外多线程编程可以使程序更加模块化,简化程序逻辑。

2 用户级线程

用户级线程库是用于用户级线程管理的例程包,支持线程的创建、终止,以及调度线程的执行并保存和恢复线程的上下文,这些操作都在用户空间进行,无需内核的支持,所以用户级线程的创建和管理等操作更快。对于那些内核本身不支持多线程的操作系统,通过用户级线程库可以使用户获得多线程编程的好处。

内核仍然以进程为单位进行调度,当内核调度一个进程运行时,用户级线程库调度该进程的一个线程执行,如果时间片允许,进程的其他线程也可能被执行,该进程的多个线程共享该进程的运行时间片,因而用户级线程的并行性会受到一定的限制。

3 内核级线程

内核级线程的所有管理操作都是由操作系统内核完成的。内核保存线程的状态和上下文信息,当一个线程执行了引起阻塞的系统调用时,内核可以调度该进程的其他线程执行。在多处理器系统上,内核可以分派属于同一进程的多个线程在多个处理器上运行,提高进程执行的并行度。

由于需要内核完成线程的创建,调度和管理,所以和用户级线程相比这些操作要慢的多,但是仍然比进程的创建和管理操作要快。

4 多线程的映射模型

对于实现了用户级线程和内核级线程的操作系统,用户级线程和内核级线程之间的可以有不同的映射方式。

多对一模型:多对一模型把多个用户级线程映射到一个内核级线程。线程的管理在用户空间实现,所以效率高。当一个线程因调用系统调用被阻塞时,整个进程被阻塞。另外,用户级线程线程不能在多处理器上并发执行。不支持内核级线程的操作系统使用多对一模型。

一对一模型:一对一模型把每个用户级线程影射到一个内核级线程。该模型允许进程的多个进程再多处理器上并行运行,当一个线程阻塞时,其他线程仍然可以运行。该模型的缺点是当创建一个用户线程时,需要创建对应得内核级线程。由于内核资源的有限性,系统能够限制系统中线程。

多对多模型:多对多模型将m个用户级线程影射到n个内核级线程,m≥n。内核级线程的数目依据应用程序的类型(要求高并发)、机器体系结构(多处理器或单处理器)或者当前系统资源的约束来确定。虽然多对一模型对创建用户级线程的数目没有限制,但这些线程在同一时刻只能有一个被执行。一对一模型可以获得高并发性,但因耗费资源而线程数会受

到限制。多对多模型具有多对一和一对一两种模型的优势,用户可以创建所需要的用户级线程,通过分配适当数目的内核级线程获得并发执行的优势并节省系统资源。

多对多映射

多线程编程的个问题:1)需要重复创建和销毁线程,比如一个网络服务器根据用户的请求不断地创建线程,然后销毁线程,长时间重复这一过程要耗费大量的处理器时间;2)如果为每个请求建立一个线程而对线程数目没有限制的话,大量创建的线程可能会耗尽系统资源。

线程池是一组被创建的线程的集合,当一个进程需要线程时,如果线程池中还有可用的线程,就从中取出一个投入使用。当线程池中没有可用的线程时,创建线程的请求必须等待,保护系统资源不被耗尽。线程池中的线程数目可以依据系统的内存,处理器数目,要处理的任务的数目来确定,或者动态地依据系统当前的资源和系统负载进行调整。

5 线程的同步

虽然多线程能给我们带来好处,但是也有不少问题需要解决。例如,对于像磁盘驱动器这样独占性系统资源,由于线程可以执行进程的任何代码段,且线程的运行是由系统调度自动完成的,具有一定的不确定性,因此就有可能出现两个线程同时对磁盘驱动器进行操作,从而出现操作错误;又例如,对于银行系统的计算机来说,可能使用一个线程来更新其用户

数据库,而用另外一个线程来读取数据库以响应储户的需要,极有可能读数据库的线程读取的是未完全更新的数据库,因为可能在读的时候只有一部分数据被更新过。

使隶属于同一进程的各线程协调一致地工作称为线程的同步。MFC提供了多种同步对象,下面我们只介绍最常用的四种: A、 使用 CCriticalSection 类

当多个线程访问一个独占性共享资源时,可以使用“临界区”对象。任一时刻只有一个线程可以拥有临界区对象,拥有临界区的线程可以访问被保护起来的资源或代码段,其他希望进入临界区的线程将被挂起等待,直到拥有临界区的线程放弃临界区时为止,这样就保证了不会在同一时刻出现多个线程访问共享资源。 CCriticalSection类的用法非常简单,步骤如下:

定义CCriticalSection类的一个全局对象(以使各个线程均能访问),如CCriticalSection critical_section;

在访问需要保护的资源或代码之前,调用CCriticalSection类的成员Lock()获得临界区对象: critical_section.Lock();

在线程中调用该函数来使线程获得它所请求的临界区。如果此时没有其它线程占有临界区对象,则调用Lock()的线程获得临界区;否则,线程将被挂起,并放入到一个系统队列中等待,直到当前拥有临界区的线程释放了临界区时为止。

访问临界区完毕后,使用CCriticalSection的成员函数Unlock()来释放临界区:critical_section.Unlock();

再通俗一点讲,就是线程A执行到critical_section.Lock();语句时,如果其它线程(B)正在执行critical_section.Lock();语句后且critical_section. Unlock();语句前的语句时,线程A就会等待,直到线程B执行完critical_section. Unlock();语句,线程A才会继续执行。 B、使用 CEvent 类

CEvent 类提供了对事件的支持。事件是一个允许一个线程在某种情况发生时,唤醒另外一个线程的同步对象。例如在某些网络应用程序中,一个线程(记为A)负责监听通讯端口,另外一个线程(记为B)负责更新用户数据。通过使用CEvent 类,线程A可以通知线程B何时更新用户数据。每一个CEvent 对象可以有两种状态:有信号状态和无信号状态。线程监视位于其中的CEvent 类对象的状态,并在相应的时候采取相应的操作。 在MFC中,CEvent 类对象有两种类型:人工事件和自动事件。一个自动CEvent 对象

在被至少一个线程释放后会自动返回到无信号状态;而人工事件对象获得信号后,释放可利用线程,但直到调用成员函数ReSetEvent()才将其设置为无信号状态。在创建CEvent 类的对象时,默认创建的是自动事件。 CEvent 类的各成员函数的原型和参数说明如下: 1、CEvent(BOOL bInitiallyOwn=FALSE, BOOL bManualReset=FALSE, LPCTSTR lpszName=NULL,

LPSECURITY_ATTRIBUTES lpsaAttribute=NULL);

bInitiallyOwn:指定事件对象初始化状态,TRUE为有信号,FALSE为无信号;

bManualReset:指定要创建的事件是属于人工事件还是自动事件。TRUE为人工事件,FALSE为自动事件;

后两个参数一般设为NULL,在此不作过多说明。 2、BOOL CEvent::SetEvent();

将 CEvent 类对象的状态设置为有信号状态。如果事件是人工事件,则 CEvent 类对象保持为有信号状态,直到调用成员函数ResetEvent()将 其重新设为无信号状态时为止。如果CEvent 类对象为自动事件,则在SetEvent()将事件设置为有信号状态后,CEvent 类对象由系统自动重置为无信号状态。

如果该函数执行成功,则返回非零值,否则返回零。 3、BOOL CEvent::ResetEvent(); 该函数将事件的状态设置为无信号状态,并保持该状态直至SetEvent()被调用时为止。由于自动事件是由系统自动重置,故自动事件不需要调用该函数。如果该函数执行成功,返回非零值,否则返回零。我们一般通过调用WaitForSingleObject函数来监视事件状态。 C、使用CMutex 类

互斥对象与临界区对象很像.互斥对象与临界区对象的不同在于:互斥对象可以在进程间使用,而临界区对象只能在同一进程的各线程间使用。当然,互斥对象也可以用于同一进程的各个线程间,但是在这种情况下,使用临界区会更节省系统资源,更有效率。 D、使用CSemaphore 类

当需要一个计数器来限制可以使用某个线程的数目时,可以使用“信号量”对象。CSemaphore 类的对象保存了对当前访问某一指定资源的线程的计数值,该计数值是当前还可以使用该资源的线程的数目。如果这个计数达到了零,则所有对这个CSemaphore 类对象所控制的资源的访问尝试都被放入到一个队列中等待,直到超时或计数值不为零时为止。一个线程被释放已访问了被保护的资源时,计数值减1;一个线程完成了对被控共享资源的访

问时,计数值增1。这个被CSemaphore 类对象所控制的资源可以同时接受访问的最大线程数在该对象的构建函数中指定。

CSemaphore 类的构造函数原型及参数说明如下: CSemaphore (LONG lInitialCount=1, LONG lMaxCount=1, LPCTSTR pstrName=NULL,

LPSECURITY_ATTRIBUTES lpsaAttributes=NULL);

lInitialCount:信号量对象的初始计数值,即可访问线程数目的初始值;

lMaxCount:信号量对象计数值的最大值,该参数决定了同一时刻可访问由信号量保护的资源的线程最大数目;

后两个参数在同一进程中使用一般为NULL,不作过多讨论;

在用CSemaphore 类的构造函数创建信号量对象时要同时指出允许的最大资源计数和当前可用资源计数。一般是将当前可用资源计数设置为最大资源计数,每增加一个线程对共享资源的访问,当前可用资源计数就会减1,只要当前可用资源计数是大于0的,就可以发出信号量信号。但是当前可用计数减小到0时,则说明当前占用资源的线程数已经达到了所允许的最大数目,不能再允许其它线程的进入,此时的信号量信号将无法发出。线程在处理完共享资源后,应在离开的同时通过ReleaseSemaphore()函数将当前可用资源数加1。

6总结

多核技术已经是现代处理器发展的主流趋势,它的诞生给软件开发技术带来了新的挑战。如何编写出高效的并行程序使之充分地利用多核的资源,这一直是学术界和工艺界致力于解决的难题。多核程序的性能调试对于开发高效的并行程序来说,具有良好地辅助作用。它通过分析程序的行为并诊断其性能瓶颈,进而给性能优化提供有效的支持。由于并行程序的动态性和不确定性,传统的代码分析技术很难有效地检测其性能瓶颈。有的研究工作提出在软件层分析程序运行时行为,这通常会引入很大的运行时开销,并且获得数据精确度很低。硬件的实现虽然运行时开销低,然而其结构扩展引入的开销又会损伤程序的性能。 CMP的低成本和广泛可用性,使得一般的软件开发人员能够进行各种级别的并行处理。并行处理不再是超级计算机或集群的专属领域。基本的开发工作站和入门级服务器现在都具有软件级和硬件级的并行处理能力。

本文来源:https://www.bwwdw.com/article/vs1f.html

Top