C的xml编程-libxml2
C的xml编程-libxml2 这里主要讲述libxml2在linux下的使用。
以下内容除了linux下的安装步骤是自己写的其余均出自http://www.blo gj ava.net/wxb_nudt/archi ve/2007/11/28/161340.html 由于该篇文章讲解的非常详细我也没必要重写一遍了。如果该篇文章早出些时候早期开发我也不会走很多弯路了。虽然在该篇文章出现之前我已经对libxml2较熟悉了并开发完毕但为了备忘现在将该篇文章作为收藏之用。在此再次感谢这篇文章的大侠为大家整理了这篇文章^_^
1. 下载与安装L IB XM L2
Li bxml2是一个C语言的XML程序库可以简单方便的提供对XM L文档的各种操作并且支持XPATH查询以及部分的支持XSLT转换等功能。 Libxml2的下载地址是http://xml s o ft.o rg/完全版的库是开源的并且带有例子程序和说明文档。最好将这个库先下载下来 因为这样可以查看其中的文档和例子。
由于我是在linux下用C语言进行开发的所以我下载的是libxml2-2.6.20.tar.gz版本的源码包。
学习参考
具体安装步骤
1、解压 $tar zxvf libxml2-2.6.20.tar.gz
2、进入解压后的安装目录 $cd libxml2-2.6.20
3、安装三部曲 1 $./confi gure
2)$m a ke
3)$make install
安装完毕。
2. Libxml2中的数据类型和函数
一个函数库中可能有几百种数据类型以及几千个函数但是记住大师的话 90%的功能都是由30%的内容提供的。对于libxml2我认为搞懂以下的数据类型和函数就足够了。
2.1 内部字符类型xml CharxmlC har是Libxml2中的字符类型库中所有字符、字符串都是基于这个数据类型。事实上它的定义是 xml stri ng.htypedef unsigned char xmlChar;
使用unsigned char作为内部字符格式是考虑到它能很好适应UTF-8编码而UTF-8编码正是libxml2的内部编码其它格式的编码要转换为这个编码才能在libxml2中使用。还经常可以看到使用xmlC har*作为字符串类型很多函数会学习参考
返回一个动态分配内存的xml Char*变量使用这样的函数时记得要手动删除内存。
2.2 xmlChar相关函数
如同标准c中的char类型一样xmlChar也有动态内存分配、字符串操作等相关函数。例如xml Mallo c是动态分配内存的函数 xmlFree是配套的释放内存函数 xml Strcmp是字符串比较函数等等。
基本上xmlChar字符串相关函数都在xmlstring.h中定义而动态内存分配函数在xmlmemory.h中定义。
2.3 xmlChar*与其它类型之间的转换
另外要注意 因为总是要在xmlC har*和char*之间进行类型转换所以定义了一个宏BAD_CAST其定义如下
xml string.h
#define BAD_CAST(xmlChar*)
原则上来说 unsigned char和char之间进行强制类型转换是没有问题的。
2.4 文档类型xmlDoc、指针xmlDocPtrxml Do c是一个struct保存了一个xml的相关信息例如文件名、文档类型、子节点等等 xmlDo cPtr等于xmlDo c*它搞成这个样子总让人以为是智能指针其实不是要手动学习参考
删除的。xmlNewDoc函数创建一个新的文档指针。xmlParseFile函数以默认方式读入一个UTF-8格式的文档并返回文档指针。xmlReadFile函数读入一个带有某种编码的xml文档并返回文档指针细节见libxml2参考手册。xmlFreeDoc释放文档指针。特别注意当你调用xmlFreeDoc时该文档所有包含的节点内存都被释放所以一般来说不需要手动调用xmlFreeNode或者xmlFreeNodeLi st来释放动态分配的节点内存除非你把该节点从文档中移除了。一般来说一个文档中所有节点都应该动态分配然后加入文档最后调用xmlFreeDo c一次释放所有节点申请的动态内存这也是为什么我们很少看见xmlNodeFree的原因。xmlSaveFile将文档以默认方式存入一个文件。xml S aveF ormatF il eEnc可将文档以某种编码/格式存入一个文件中。
2.5 节点类型xmlNode、指针xmlNodePtr
节点应该是xml中最重要的元素了 xmlNode代表了xml文档中的一个节点实现为一个struct 内容很丰富 tre e.htypedef struct_xmlNo de xmlNode;typedef xmlNode*xmlNo dePtr;
学习参考
struct_xmlNo de {void *_private;/*application data*/xmlElementType type; /*type number,must besecond! */const xmlChar *name; /*the name of the node,or the entity*/struct_xmlNode*children; /*parent->chil ds link*/struct_xmlNode*last; /*last child link*/struct_xmlNode*parent;/*child->parent link*/struct_xmlNode*next; /*next sibling link*/struct_xmlNode*prev; /*previous sibling link*/struct_xmlDoc*doc;/*the co ntaining document*/
/*End of common part*/xmlNs *ns; /*pointer to theassociated namespace*/xmlChar *content; /*the content*/struct_xml Attr*pro perti es;/*prop erties li st*/xmlNs *nsDef; /*namespace definitionson thi s node*/void *psvi;/*for type/PSVI informations */unsigned short line; /* line number*/unsigned short extra; /*extra data for XPath/XSLT*/学习参考
};
可以看到节点之间是以链表和树两种方式同时组织起来的 next和prev指针可以组成链表而parent和children可以组织为树。 同时还有以下重要元素l 节点中的文字内容 contentl 节点所属文档 do cl 节点名字 namel 节点的namespace nsl 节点属性列表 pro pertie s
Xml文档的操作其根本原理就是在节点之间移动、查询节点的各项信息并进行增加、删除、修改的操作。xml Do c SetRo otElement函数可以将一个节点设置为某个文档的根节点这是将文档与节点连接起来的重要手段 当有了根结点以后所有子节点就可以依次连接上根节点从而组织成为一个xml树。
2.6 节点集合类型xmlNo deS et、指针xmlNo deS etPtr节点集合代表一个由节点组成的变量节点集合只作为Xp ath的查询结果而出现XPAT H的介绍见后面 因此被定义在xpath.h中其定义如下
/*
学习参考
*A node-set (an unordered collection of nodes withoutduplicates).
*/typedef struct_xmlNo de Set xmlNo de Set;typedef xmlNode Set *xmlNode S etPtr;struct_xmlNode Set {int no deNr; /*number of no des in the set */int nodeMax; /*size of the array as allocated*/xmlNo dePtr*nodeTab;/*array of nodes in no particularorder*/
/*@@with_ns to check wether namespace nodes shouldbe looked at@@*/
};
可以看出节点集合有三个成员分别是节点集合的节点数、最大可容纳的节点数 以及节点数组头指针。对节点集合中各个节点的访问方式很简单如下xmlNode S etPtr no de set=XPATH查询结果;fo r(int i=0; i<no de s et->no deNr; i++)
{no des et->no deTab[i];
学习参考
}
注意 libxml2是一个c函数库因此其函数和数据类型都使用c语言的方式来处理。如果是c++我想我宁愿用STL中的vector来表示一个节点集合更好而且没有内存泄漏或者溢出的担忧。
3. 简单xml操作例子
了解以上基本知识之后就可以进行一些简单的xml操作了。当然还没有涉及到内码转换使得xml中可以处理中文、xpath等较复杂的操作。
3.1 创建xml文档
有了上面的基础创建一个xml文档显得非常简单其流程如下l 用xmlN ewDo c函数创建一个文档指针do cl 用xmlNewNode函数创建一个节点指针ro ot_no de
l 用xml Do c SetRo otElement将ro ot_no de设置为do c的根结点l 给ro ot_no de添加一系列的子节点并设置子节点
的内容和属性l 用xml SaveFil e将xml文档存入文件l 用xmlFreeDo c函数关闭文档指针并清除本文档学习参考
中所有节点动态申请的内存。
注意有多种方式可以添加子节点第一是用xmlNewTextChil d直接添加一个文本子节点第二是先创建新节点然后用xmlAddC hild将新节点加入上层节点。源代码文件是CreateXmlFile.cpp如下
/***************************************************
*****************created: 2007/11/09created: 9:11:2007 15:34filename:CreateXmlFile.cppauthor: Wang xuebindepend: libxml2.libbuild: nmake TARGET_NAME=CreateXmlFile
purpo se: 创建一个xml文件
***************************************************
******************/
#inclu de<stdi o.h>
#include<li bxml/pars er.h>
#include<li bxml/tre e.h>
#include<io stream.h>int main()
学习参考
企鹅小屋:垃圾服务商有跑路风险!企鹅不允许你二次工单的,二次提交工单直接关服务器,再严重就封号,意思是你提交工单要小心,别因为提交工单被干了账号!前段时间,就有站长说企鹅小屋要跑路了,站长不太相信,本站平台已经为企鹅小屋推荐了几千元的业绩,CPS返利达182.67CNY。然后,站长通过企鹅小屋后台申请提现,提现申请至今已经有20几天,企鹅小屋也没有转账。然后,搞笑的一幕出现了:平台账号登录不上提示...
profitserver正在对德国vps(法兰克福)、西班牙vps(马德里)、荷兰vps(杜廷赫姆)这3处数据中心内的VPS进行5折优惠促销。所有VPS基于KVM虚拟,纯SSD阵列,自带一个IPv4,不限制流量,在后台支持自定义ISO文件,方便大家折腾!此外还有以下数据中心:俄罗斯(多机房)、捷克、保加利亚、立陶宛、新加坡、美国(洛杉矶、锡考克斯、迈阿密)、瑞士、波兰、乌克兰,VPS和前面的一样性...
今天中午的时候有网友联系到在选择网站域名建站和主机的时候问到域名和IP地址有没有关联,或者需要注意的问题。毕竟我们在需要建站的时候,我们需要选择网站域名和主机,而主机有虚拟主机,包括共享和独立IP,同时还有云服务器、独立服务器、站群服务器等形式。通过这篇文章,简单的梳理关于网站域名和IP之间的关系。第一、什么是域名所谓网站域名,就是我们看到的类似"www.laozuo.org",我们可以通过直接记...