
parsing
文章 11浏览 12
使用XML解析器实现作为OSGi服务
UsingXMLparserimplementationasOSGiservice我正在使用OSGi(Equinox平台)开发一个应用程序,其中一个包需要解析XML文件。到目前为止,我使用SAX(javax.xml.parsers.SAXParserFactory)实现了这个,我想从平台检索SAXParserFactory。我看到OSGi标准提供了XMLParserActivator以允许JAXP…如何使用正则表达式提取”==”两边的操作数?
Howtoextracttheoperandsonbothsidesof"=="usingregex?语言和包python3.8,正则表达式描述输入和想要的输出如下:if(programWorkflowState.getTerminal(1,2)==Boolean.TRUE){想要:programWorkflowState.getTerminal(1,2)和Boolean.TRUEbooleani…从 HTML 到 XHTML 的转换会更改欧元符号,从而阻止正确的 XML 解析
ConversionfromHTMLtoXHTMLchangeseurosymbol,preventingcorrectXMLparsing我正在从HTML文件中提取信息,方法是使用Java中的SAX对其进行解析。解析程序给了我,它已经在使用SAX,所以我想保持这种方式。我要做的是:我从网站获取HTML文件使用JTidy库将其转换为有效的XML。然而,这个库将所有€符号转换为"您遇到的问题是编码问…在令牌流中解析上下文无关语言
Parsingcontext-freelanguagesinastreamoftokens问题给定具有任意规则和标记流的上下文无关文法,如何有效识别匹配文法的流片段?例子:语法S->ASB|ABA->aB->baabaaabbc...S->ASB|ABA->aB->bS'->S|GS'|S'GS'|S'GG->sigma*(所以本质上,多个as后跟相…如何从单词列表中制作 Haskell 解析器?
HowcanImakeaHaskellparserfromalistofwords?我是Haskell初学者,使用Attoparsec在文本中查找一些颜色表达式。例如,我希望能够匹配文本中的"浅蓝绿色"和"浅蓝绿色"。但当然,我需要一个针对任何这样的字符串的通用解决方案。所以我一直在想它会像"light">>sep>>"blue">>sep>>"gr…Tab 完成和部分完成
TabCompletionandPartialCompletion我想做一个程序,它以类似于Linux上的ip的方式接受命令。例如,我想要一个完整的showinterfaceoptions命令,但用户可以只输入showinoptions甚至只输入sio如果它们与其他命令不冲突。我对如何解决这个问题有一些想法,我想在C中执行此操作。所以问题是什么是解决此问题的好方法,同时在Linux/UNIX系统之…PEGJS:如何将 NOT (!) 逻辑运算符添加到解析 AND (
PEGJS:HowtoaddNOT(!)logicaloperatortogrammarthatparsesAND(&&)OR(||)logicstatements我对编写语法非常陌生(确切地说是第一次),我想创建一个可以为基本逻辑语句返回AST的语法。到目前为止,我有一个可以处理AND、OR逻辑的语法(我只是修改了官方pegjs网站上的基本计算器示例)。以下是语法当前的作用:声明…ANTLR4 如何根据规则更改隐藏字符?
ANTLR4howdochangehiddencharactersbasedonrule?我正在尝试解析结构错误的输入文件,因为通常会跳过换行符,但在某些情况下它用于终止语句,因此有时必须匹配它。然而在这种情况下,换行符似乎成为一般的正常标记,不能被跳过。为了说明我的问题,请考虑以下语法:text:(line'\')+;line:(ID)+|'('ID*')';ID:[a-zA-Z]+;WS:[\…使用简单的 html dom 解析器通过每个元素的两个或多个属性来查找部分
Findingpartwithsimplehtmldomparserbytwoormoreattributesperoneelement我想说,我知道,很多人认为,简单的HTMLDOM解析器对于HTML解析器来说是一个非常糟糕的选择。我现在仍然需要使用它。我阅读了一些文章,其中描述了如何通过每个元素的两个或多个属性进行搜索。他们提出了类似的东西和数组过滤的一种可能性foreach(tag[attr…Python — 解析文件(docx、pdf 和 odt)并将内容转换为我的数据模型
Python--Parsingfiles(docx,pdfandodt)andconvertingthecontentintomydatamodel我正在编写一个导入/导出工具,用于导入docx、pdf和odt文件;其中写了一本书。我们已经有了一个用于.epub格式的工具,并且我们希望在此基础上扩展功能,以便该网站的用户可以拥有更大的灵活性。到目前为止,我查看了PDFMiner,还发现docx只是…Parsec-Parser 工作正常,但能做得更好吗?
Parsec-Parserworksalright,butcoulditbedonebetter?我尝试这样做:以如下形式解析文本:SomeText#{0,0,0}someText#{0,0,0}#{0,0,0}moreText#{0,0,0}变成一些数据结构的列表:[Inside"SomeText",Outside(0,0,0),Inside"someText",Outside(0,0,0),O…