视频:南京大学《软件分析》课程10(Pointer Analysis - Foundations II)哔哩哔哩_bilibili
PPT: https://cs.nju.edu.cn/tiantan/software-analysis/PTA-FD.pdf
笔记参考:(34条消息) 【课程笔记】南大软件分析课程—16课时完整版_bsauce的博客-CSDN博客_南京大学软件分析
【课程笔记】南大软件分析课程7——指针分析基础(课时9/10) - 简书 (jianshu.com)
书接上回
指针分析如何处理函数调用
老师再次提及了 CHA 算法的缺陷,CHA 是基于声明类型,所以不精准,可能会引入冗余的调用边和指针关系。
- 因为声明类型可能是父类,而实例化的实际是个子类,当变量调用子类方法的时候,CHA 分析的时候会将父类的所有子类都纳入变量的指向关系,这样就多了很多实际没有的调用边和指针关系
所以相对于 CHA,基于 pt (a)的指针分析要更加精准,以过程间指针分析和 CG 构造同时进行,动态的去传播和添加指向关系,这样构成的调用图就没有冗余边了。
调用语句规则
概括来说就是四步走
- dispatch 来找到方法 k 是到底是哪个函数
- 传 receiver object(第四行):把 x 指向的对象 oi(就是第一行的 pt (x))传入 m 函数的 this 变量
- 传参数 (第二行和第五行):把每个参数指向的对象 ou 传给函数 m 的参数,mpj 意思是 m 的第 j 个参数,同时建立 PFG 边
- 传返回值(第三行和第六行):pt (mret)传给 pt (r),同时建立 PFG 边
问题:为什么 PFG 中不添加 x->mthis 边?此时的 x 指向的那些 oi 和 m 具有相同的对象,所以可以流向 mthis,但是 PFG 是动态构建的,之后 x 可能指向了和 m 不是同一类的对象,那么此时将这些对象流向 mthis 是不对的。
过程间 PTA 算法
(标黄色的地方是和过程内分析不同的地方)
符号解释
- mentry:入口 main 函数
- Sm:函数m中的语句
- S:可达语句的集合(就是RM中的语句)
- RM:可达函数的集合
- CG:调用图的边
步骤
- 从入口函数开始,首先 addreachable m_entry
- AddReachable ()
- 将函数或对象加入集合 RM 表示该函数或对象已可达
- 然后将 m 的语句并入集合 s 中,表示 m 中的语句都已可达
- 处理 sm 中的 NEW 语句:将指向关系<xi, {o_i}>加入 WL 等待处理集合
- 处理 sm 中的 assign 语句:向 PFG 中添加边
- AddReachable ()
- 处理 WL 集合
- 取出一个待传播的指向关系<n, pts>
- 去除 pts 中的 pt (n)避免重复传播
- 将 $\Delta$ 传播到 n 的指向集合中
- 如果 n 表示一个变量 x,并且存在 load 和 store 语句,就对 $\Delta$ 中的每个 o_i 进行 addedge
- 如果 n 表示一个变量 x,则对 $\Delta$ 中的每个 o_i 和 x 进行 ProcessCall 操作
- ProcessCall 用于处理变量 x 对函数的调用操作(就是本节一开始说的 CALL 语句)
- 从 S 语句集合中变量 x 的调用语句 L(调用的函数用 k 表示)
- 用 dispatch 去求解函数 k 到底是调用的哪个对象的哪个函数,结果用 m 表示,然后把待传播的指向关系<m_this, {o_i}>加入 WL
- 如果语句 L 到 m 的边在调用图中没有,就在调用图中添加一条从 L 指向 m 的边,并且设置 m 为可达
- 对于 m 中的每个参数,都在 PFG 中添加一条实参指向形参的边
- 添加一条 m 返回值指向调用处返回值的边