根据上周开会之后,写了一个并行等待方案,基本上可行,就是不知道有没有类似的东西,或者已经有人做过了。关于那个wave front algorithm,我也仔细阅读了一些论文,有人对他进行了优化,然后我也做了一些改进。
和山口老师的讨论中,我了解到其实我们是需要一个dynamic的调度,所以就不再存在什么static的优化了,对于所有的算法,都可以用我们的方法来进行动态调度。可能在某些程度上,没有对某一算法单独的加速要好,但是从大体上讲,更加方便和简单。在前面的日志中,已经写了一些关于动态调度的问题,这里就不再继续讨论。
这周把这个动态调度算法基本实现了一个模拟,就是按照设计,可以相互传递信息,传递数据,PPU作为总调度,为每一个SPU开一个线程,来完成相应的任务。同时,我还学习了harris interest point算法,实现了角点检测功能,如果以后需要将这个作为benchmark的话,可以直接拆分程序,进行并行的计算。
今天需要讨论的几个问题:
1.应该是所有SPU运行的代码都一样,只是根据传来的信息不同和接收的参数不同,调用的函数不同,得到的结果也不同。
2.数据量的划分,比如一个100*100的图像矩阵,怎么划分才比较好,因为如果化成100个10*10,那么边角问题的处理。
3.实际操作,和benchmark的实现,因为以前没有做过类似东西。
4.是不是要选择这个harris interest point算法,还是用那个wave front的比较好表现。
其他问题:
1.新的中国学生?
2.3月份的假期怎么安排。
2010-2-9 Gu