使用XSD进行批量数据导入时生成的XML数据有效性这样的功能已经不是第一次做了,之前做的时候都没有碰到什么问题,这些天在开发中遇到了一个很头痛的问题就是无论XSD文件规则怎么写,验证都是通过的。
下面是具体的代码:
C#验证部分:
/// <summary> /// 对已转换成映射XML文件使用指定架构文件进行验证 /// </summary> /// <param name="mappingXmlFile">映射XML文件</param> /// <param name="schemaFile">架构文件</param> /// <returns>返回空字符串表示验证成功,否则返回错误信息</returns> public string ValidateMappingXMLFile(string mappingXmlFile, string schemaFile) { string namespaceUrl = "http://tempuri.org/MsisdnSchema.xsd"; XmlReaderSettings settings = new XmlReaderSettings(); settings.ValidationType = ValidationType.Schema; settings.Schemas.Add(namespaceUrl, schemaFile); settings.ValidationEventHandler += new System.Xml.Schema.ValidationEventHandler(settings_ValidationEventHandler); sb = new StringBuilder(); XmlReader reader = XmlReader.Create(mappingXmlFile, settings); try { reader.MoveToContent(); while (reader.Read()) { if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI != namespaceUrl) { return "Data does not match the specifications!"; } } } catch (XmlException ex) { sb.AppendFormat(ex.Message + "\n"); } finally { reader.Close(); } if (String.IsNullOrEmpty(sb.ToString())) { return string.Empty; } else { return "Validation Faild,Please check the validity of the data:" + sb.ToString(); } } public void settings_ValidationEventHandler(object sender, System.Xml.Schema.ValidationEventArgs e) { sb.Append(e.Message + "\n"); }
XML数据:
<?xml version="1.0" encoding="utf-8"?> <MSISDN> <List> <BATCH_IMPORT_ID>6adbca51-c55f-4022-bcc0-84b209a78a38</BATCH_IMPORT_ID> <BATCH_NO>20131027172271517</BATCH_NO> <PORT_IN_MSISDN>31632000000</PORT_IN_MSISDN> <CUSTOMER_TYPE>Business</CUSTOMER_TYPE> <ID_TYPE>Passport</ID_TYPE> <ID_NUMBER>1234567</ID_NUMBER> <NATIONALITY>Netherlands</NATIONALITY> <DAY_OF_BIRTH>2013-10-27</DAY_OF_BIRTH> <COUNTRY_ID>Netherlands</COUNTRY_ID> <LANGUAGE>Dutch - The Netherlands</LANGUAGE> <COMPANY>ET.</COMPANY> <STATUS_ID>Active</STATUS_ID> <TITLE_ID>Mr.</TITLE_ID> <FIRST_NAME>Mark</FIRST_NAME> <MIDDLE_NAME> </MIDDLE_NAME> <LAST_NAME>Mulder</LAST_NAME> <EMAIL>654645</EMAIL> <ADDRESS>Schipholboulevard</ADDRESS> <HOUSE_NO>249</HOUSE_NO> <HOUSE_EXTENTION> </HOUSE_EXTENTION> <ZIP_CODE>4324</ZIP_CODE> <CITY>Schipholboulevard</CITY> <PACKAGE_NAME>88 mobile prepaid 2.5.0</PACKAGE_NAME> <BILLING_EMAIL>martin.mulder@elephanttalk.com</BILLING_EMAIL> <CUSTOMER_ID_DONOR>56346546</CUSTOMER_ID_DONOR> <WISHDATE_PORTING>2013-10-27</WISHDATE_PORTING> <NETWORK_OPERATOR>BEN</NETWORK_OPERATOR> <SERVICE_PROVIDER>Atlantic Telecom</SERVICE_PROVIDER> </List> </MSISDN>
XSD验证架构
<?xml version="1.0" encoding="utf-8"?> <xs:schema id="MSISDNSchema" targetNamespace="http://tempuri.org/MsisdnSchema.xsd" elementFormDefault="qualified" attributeFormDefault="unqualified" xmlns="http://tempuri.org/MsisdnSchema.xsd" xmlns:mstns="http://tempuri.org/MsisdnSchema.xsd" xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:element name="MSISDN"> <xs:complexType> <xs:sequence> <xs:element maxOccurs="unbounded" name="List"> <xs:complexType> <xs:sequence> <xs:element name="BATCH_IMPORT_ID" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="36"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="BATCH_NO" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="PORT_IN_MSISDN"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="CUSTOMER_TYPE" minOccurs="0" default="Business"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="ID_TYPE" minOccurs="0" default="Passport"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="ID_NUMBER" default="1234567"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="20"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="NATIONALITY" minOccurs="0" default="Netherlands"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="20"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="DAY_OF_BIRTH" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:date"> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="COUNTRY_ID" minOccurs="0" default="Netherlands"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="LANGUAGE" minOccurs="0" default="Netherlands"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="COMPANY" minOccurs="0" fixed="ET."> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="STATUS_ID" minOccurs="0" fixed="Active"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="20"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="TITLE_ID" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="20"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="FIRST_NAME" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="MIDDLE_NAME" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="LAST_NAME" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="EMAIL" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> <xs:pattern value="([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="ADDRESS" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="HOUSE_NO" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="25"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="HOUSE_EXTENTION" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="ZIP_CODE" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="25"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="CITY" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="PACKAGE_NAME" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="BILLING_EMAIL" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="CUSTOMER_ID_DONOR" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="100"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="WISHDATE_PORTING" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:date"> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="NETWORK_OPERATOR" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="10"/> </xs:restriction> </xs:simpleType> </xs:element> <xs:element name="SERVICE_PROVIDER" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:maxLength value="50"/> </xs:restriction> </xs:simpleType> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
可见,<EMAIL>654645</EMAIL>项是一个不符合Email正则表达式验证的Email地址,可是执行的结果依然是没有进行验证。
在园子里的另一篇文章http://q.cnblogs.com/q/38157/ 给了我启发,我把XML数据的对XSD命名空间的引用,<MSISDN xmlns="http://tempuri.org/MsisdnSchema.xsd" >
发现这次验证是可以正常进行的,说明问题出在了XML数据上。
“XmlReader 在执行验证的时候不光需要xsd文件,还需要xml文件显示的引用xsd的NameSpaces,这样才就可以去匹配验证每个元素。”果然如帖子中说的一样。
可这样格式的XML数据,在进行校验过后,要转换成Dataset进行再次处理会比较麻烦,需要先获取XML架构再取数据,那么能不能不修改XML数据就验证成功呢?
我对代码和XSD数据进行了如下修改:
xsd里面
去掉
targetNamespace="http://tempuri.org/MsisdnSchema.xsd"
代码里面(写出的部分为替换注释掉部分的代码)
//string namespaceUrl = "http://tempuri.org/MsisdnSchema.xsd"; //settings.Schemas.Add(namespaceUrl, schemaFile); settings.Schemas.Add(null, schemaFile); //if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI != namespaceUrl) if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI !=null)
再运行程序,代码就通过了,验证可以正常运行。
可能有不少同学在学习XSD验证XML的时候,会参考园子里的一篇博客
http://www.cnblogs.com/chenxizhang/archive/2009/06/19/1507121.html
我想指出的是,
如果XML数据文件没有引用任何XSD的命名空间,那么在代码中,是不需要设置XmlReader的namespaceUrl的,并且XSD中也不需要设置targetNamespace项的值,否则验证是不会进行的,验证结果永远都是成功。