一、概述
在有 CPU
和 GPU
参与的一种运算中,比如深度学习推理,CPU 需要预处理数据,然后交给 GPU 处理,最后 CPU 对 GPU 的运算结果进行后处理。
在整个过程中都是 FIFO
,即数据 ABC 按顺序输入,也需要按 A’B’C’ 顺序输出。
如果采用同步阻塞的方式,在 CPU 预处理时 GPU 处于空闲状态,GPU 运算时 CPU 后处理处于空闲状态并且也不能进行后续数据的预处理。这样影响整体的吞吐。
期望是 GPU 运算时,CPU 可以同时进行数据预处理和后处理。这是典型的单生产者单消费者模式。
在两个线程之间传递数据时,为确保线程安全,可以在一个线程每次 malloc
或 new
申请内存,在另一个线程 free
或 delete
。为了避免频繁的内存分配和释放,需要使用到内存池。
本文描述采用有界队列实现内存池,适用场景和限制:
- 需要把内存使用控制在一定范围内。
- 整个过程不允许丢弃数据。
- 单生产者和单消费者。即不会(也不允许)同时生产,不会(也不允许)同时消费。如果确实要多线程生产或多线程消费,本代码并不适用。
- 生产和消费之间线程安全。