作者：解学武

广义表的存储结构详解（包含2种存储方案）

广义表是什么广义表的深度和长度

由于广义表中既可存储原子（不可再分的数据元素），也可以存储子表，因此很难使用顺序存储结构表示，通常情况下广义表结构采用链表实现。

使用顺序表实现广义表结构，不仅需要操作 n 维数组（例如 (1,(2,(3,4))) 就需要使用三维数组存储），还会造成存储空间的浪费。

使用链表存储广义表，首先需要确定链表中节点的结构。由于广义表中可同时存储原子和子表两种形式的数据，因此链表节点的结构也有两种，如图 1 所示：

图 1 广义表节点的两种类型

如图 1 所示，表示原子的节点由两部分构成，分别是 tag 标记位和原子的值，表示子表的节点由三部分构成，分别是 tag 标记位、hp 指针和 tp 指针。

tag 标记位用于区分此节点是原子还是子表，通常原子的 tag 值为 0，子表的 tag 值为 1。子表节点中的 hp 指针用于连接本子表中存储的原子或子表，tp 指针用于连接广义表中下一个子表（也可能是 NULL）。

因此，广义表中两种节点的 C 语言表示代码为：

typedef struct Node {
    int tag;//标志域
    union {
        char atom;//原子结点的值域
        struct {
            struct Node* hp, * tp;
        }ptr;//子表结点的指针域，hp指向表头；tp指向表尾
    }un;
}GLNode, * Glist;

这里用到了 union 共用体，因为同一时间此节点不是原子节点就是子表节点，当表示原子节点时，就使用 atom 变量；反之则使用 ptr 结构体。

例如，广义表 (a,(b,c,d)) 是由一个原子 a 和子表 (b,c,d) 构成，而子表 (b,c,d) 又是由原子 b、c 和 d 构成，用链表存储该广义表如图 2 所示：

图 2 广义表 (a,(b,c,d)) 的结构示意图

从图中可以看到，存储原子 a、b、c、d 时都是用子表包裹着表示的，因为原子 a 和子表 (b,c,d) 在广义表中同属一级，而原子 b、c、d 也同属一级。

除非 C 是一个空表，指针 C 的值为 NULL，否则指针 C 指向的一定是 tag 值为 1 的子表结点。

图 2 中链表存储的广义表用 C 语言代码表示为：

Glist creatGlist(Glist C) {
    //广义表C
    C = (Glist)malloc(sizeof(GLNode));
    C->tag = 1;

    //表头原子‘a’
    C->un.ptr.hp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.hp->tag = 0;
    C->un.ptr.hp->un.atom = 'a';

    //表尾子表(b,c,d),是一个整体
    C->un.ptr.tp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->tag = 1;
    C->un.ptr.tp->un.ptr.hp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.tp = NULL;

    //开始存放下一个数据元素(b,c,d),表头为‘b’，表尾为(c,d)
    C->un.ptr.tp->un.ptr.hp->tag = 1;

    //存储 'b'
    C->un.ptr.tp->un.ptr.hp->un.ptr.hp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.hp->un.ptr.hp->tag = 0;
    C->un.ptr.tp->un.ptr.hp->un.ptr.hp->un.atom = 'b';

    //存放子表(c,d)，表头为c，表尾为(d)
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->tag = 1;
   
    //存储原子 'c'
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.hp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.hp->tag = 0;
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.hp->un.atom = 'c';

    //存放表尾(d)
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp->tag = 1;
    //存储 'd'
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp->un.ptr.hp = (Glist)malloc(sizeof(GLNode));
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp->un.ptr.hp->tag = 0;
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp->un.ptr.hp->un.atom = 'd';
    C->un.ptr.tp->un.ptr.hp->un.ptr.tp->un.ptr.tp->un.ptr.tp = NULL;
    return C;
}

广义表的另一种存储结构

如果你觉得图 2 这种存储广义表的方式不合理，可以使用另一套表示广义表中原子和子表结构的节点，如图 3 所示：

图 3 广义表的另一套节点结构

如图 3 所示，表示原子的节点构成由 tag 标记位、原子值和 tp 指针构成，表示子表的节点还是由 tag 标记位、hp 指针和 tp 指针构成。

图 3 的节点结构用 C 语言代码表示为：

typedef struct Node {
    int tag;//标志域
    union {
        int atom;//原子结点的值域
        struct Node* hp;//子表结点的指针域，hp指向表头
    }un;
    struct Node* tp;//这里的tp相当于链表的next指针，用于指向下一个数据元素
}GLNode, * Glist;

采用图 3 中的节点结构存储广义表 (a,(b,c,d)) 的示意图如图 4 所示：

图 4 广义表 (a,(b,c,d)) 的存储结构示意图

无论 C 是否为空表，指针 C 指向的都是一个 tag 值为 1 的子表结点。当 C 为空表时，指针 C 所指结点的 hp 和 tp 指针都为 NULL。

图 4 存储广义表对应的 C 语言代码为：

Glist creatGlist(Glist C) {
    C = (Glist)malloc(sizeof(GLNode));
    C->tag = 1;
    C->un.hp = (Glist)malloc(sizeof(GLNode));
    C->tp = NULL;

    //存储 'a'
    C->un.hp->tag = 0;
    C->un.hp->un.atom = 'a';

    //存储(b,c,d)
    C->un.hp->tp = (Glist)malloc(sizeof(GLNode));
    C->un.hp->tp->tag = 1;

    C->un.hp->tp->un.hp = (Glist)malloc(sizeof(GLNode));
    C->un.hp->tp->tp = NULL;
    //存储'b'
    C->un.hp->tp->un.hp->tag = 0;
    C->un.hp->tp->un.hp->un.atom = 'b';
    C->un.hp->tp->un.hp->tp = (Glist)malloc(sizeof(GLNode));
    //存储'c'
    C->un.hp->tp->un.hp->tp->tag = 0;
    C->un.hp->tp->un.hp->tp->un.atom = 'c';
    C->un.hp->tp->un.hp->tp->tp = (Glist)malloc(sizeof(GLNode));
    //存储'd'
    C->un.hp->tp->un.hp->tp->tp->tag = 0;
    C->un.hp->tp->un.hp->tp->tp->un.atom = 'd';
    C->un.hp->tp->un.hp->tp->tp->tp = NULL;
    return C;
}

需要初学者注意的是，无论采用以上哪一种节点结构存储广义表，都不要破坏广义表中各数据元素之间的并列关系。拿 (a,(b,c,d)) 来说，原子 a 和子表 (b,c,d) 是并列的，而在子表 (b,c,d) 中原子 b、c、d 是并列的。
声明：当前文章为本站“玩转C语言和数据结构”官方原创，由国家机构和地方版权局所签发的权威证书所保护。

广义表是什么广义表的深度和长度

加站长微信免费领
C语言学习小册加站长微信免费领C语言学习小册
微信ID：xiexuewu333