大厂之路一由浅入深、并行基础、源码分析一 线程的基础概念

墨尘 134 0

*** 对于java后端研发工程师的学习,高并发是重点也是难点,本想在书上做标记即可,但发现看过一遍后并没有在脑中有系统的框架,因此通过写博客,以及吸收别人的博客精华做总结、***


应用场景:其实主要用于两大块,“图像处理”和“服务端程序”


为什么要研究并发:主要是因为就目前的科研水平而言,无法在物质分子以下层面进行工作(量子计算机的由来,因本身研究方向是量子密钥,所以也有所了解),所以4GB的芯片已经接近极限了(集成电路的晶体管已经不能翻倍,也可以芯片的性能不能再提高,Intel公司在2004年先后推迟了4GB芯片的发布时间最终取消了4GB计划,这也就是”摩尔定理的失效“)。2005年开始,我们就不再追求单核的计算速度,而是研究如何将多个独立的计算单元整合到单独的CPU上,也就是”多核CPU“,甚至专业服务器配有好几个独立的CPU,并且每一个CPU都包含多核,这时候”摩尔定理生效(每18~24月,CPU的核心数翻一翻)“了。因此,我们可以这样说:“并发或多或少是由于硬件设计者已经无计可施导致的,他们将摩尔定律的失效的责任推给了软件的开发者"“简化的硬件设计方案必然会带来软件设计的复杂性”。


关于并行的两个定律:Amdahl定律和Gustafson定律,两个定律虽然得处的结果是矛盾的,但是它们是通过不同的角度来分析的,但是统一的当并行化代码比例到100%,则加速比为n(处理器个数)


当我们知道为什么要研究并发的时候,我们就要知道几个相关概念:


同步:同步方法调用一旦开始,调用者必须等到方法调用返回,才能继续后续的工作。


异步:异步方法就不需要等到方法调用返回,就可以进行后续的工作。


并行:就是”同时进行“,比如多核CPU(坐缆车上去看风景)。


并发:并发是视觉上的并行,并不是真正意义上的”同时进行“,而是多个任务交替执行,只不过交替频率高,给我们的感觉是”同时进行“(比如下雨天爬山,我们要一边看路,一一边看风景)。


临界区:临界区表示一种公共资源或共享资源,可以多个线城使用,但是每一次,只能一个线程使用它,一旦临界区资源被占用,其他线程想要使用这个资源就必须得等待(比如一个办公室的打印机,或者xx体验店的充气xx)。


阻塞:阻塞是多线程之间的相互影响,当一个线程占用了临界区资源,其他所有需要这个资源的线程就必须在这个临界区中等待。等待会导致线程挂起,这就是阻塞。


非阻塞:和阻塞不同的是,线程不会挂起,而是不断尝试向前执行。


多线程活跃性问题:


死锁(最糟糕的情况):A等B,B等A,都等待对方释放公共资源。


饥饿:一个或多个线程因为种种原因无法获得所需要的资源,导致一直无法执行。比如:Ⅰ、它的线程优先级太低,而高优先级的线程不断抢断资源,导致低线程无法工作。Ⅱ、某一个线程一直占用资源不放,导致它需要的这个资源的线程无法正常执行。


活锁:线程之间相互“谦让”,主动释放资源等。


并发级别:

由于临界区的存在,多线程之间的并发必须控制,根据并发的策略,我们可以把并发的级别分成5个级别,阻塞,无饥饿,无障碍,无锁,无等待。


阻塞(悲观策略):一个线程占用共享资源,其他线程就需要挂起等待,无法继续执行,比如我们用到的 “synchronized”关键字或者 重入锁。

无饥饿(阻塞调度)(悲观策略):如果线程之间有优先级,那么线程调度的时候总是要倾向于先满足高优先级的线程,这就可能导致低优先级的线程产生饥饿(这时候我们可以通过 锁是公平的,按照 先来后到(FIF0) 的规则进行线程调度)

无障碍“(非阻塞调度)(乐观策略):两个线程可以无障碍执行,不会因为临界区的问题导致一方被挂起,但是如果多个线程进行回滚,而都走不出临界区。换一种说法:不同的线程都可以进入临界区,读线程可以,但是写线程的话需要判断当前数据有没有发生竞争,也就是有没有中途被别人修改,如果修改了则回滚,如何实现?我们可以通过设置一个"一致性标记"来实现,再修改前先保存这个标记,然后再修改数据,然后看这个标记是否被人改过。

无锁:本质上是无障碍的改进,解决了“无障碍”并发级别的缺点,也就是 “无障碍”+“一致性标记”,能保证总有一个线程可以走出临界区,一般我们通过do-while来循环判断,判断用的 compareAndSet,这里我们额外探讨,本质是 CAS 语句。

无等待:本质上是无锁的改进,因为无锁只是要求一个线程可以在有限步内完成操作,而无等待要求所有的线程都必须在有限步内完成。无等待可以根据do-while循环次数来进一步分成 有界无等待和线程数无关的无等待。应用:RCU结构(Read Copy Update),所有的读线程都是无等待的,它们既不会被锁定等待也不会引起任何冲突。写线程可以先修改原始数据的副本,接着只修改副本数据,修改完后在合适的时机回写数据。

内存模型(JMM)中,多线程的AVO:原子性、可见性、有序性

1、原子性:一个操作是不可中断的,常见的一些原子性操作:

1)除long和double之外的基本类型的赋值操作(32位)

2)所有引用reference的赋值操作

3)java.concurrent.Atomic.* 包中所有类的一切操作

2、可见性:当一个线程修改了共享变量的值时,其他线程能够立即知道这个修改。可见性是一个综合性问题:比如缓存优化,硬件优化(比如内存的读写操作不会立即执行,而是会先进入一个硬件队列等待(可以通过设置volatile来修改直接写进内存,而不是写入缓存)),还有一些别的原因,比如指令重排以及编译器优化。

3、有序性:有序性问题的原因是程序在执行时,可能会进行指令重排,重排后的指令与原指令的顺序未必一致(指令重排的前提是保证串行语义的一致性,但不能保证多线程的语义也一致)( 指令重排有优劣,比如优点可以减少中断,但是缺点是可能会影响“可见性”):哪些指令不能重排:

1)volatile规则:volatile变量的写先与读发生,这保证了volatile变量的可见性。

2)锁规则:解锁(unlock)必然发生在随后的加锁(lock)前。

3)传递性:A先与B,B先与C,那么A必然先于C。

4)线程的start()方法先于它的每一个动作。

5)线程的所有操作先于线程的终结(Thread.join())。

6)线程的中断(interrupt())先于被中断线程的代码。

7)对象的构造函数的执行,结束先于finalize()方法。




原文链接:https://blog.csdn.net/wwj17647590781/article/details/115792371


标签: #java #多线程

  • 评论列表

留言评论