parsing

文章 11浏览 12

使用XML解析器实现作为OSGi服务
UsingXMLparserimplementationasOSGiservice我正在使用OSGi(Equinox平台)开发一个应用程序，其中一个包需要解析XML文件。到目前为止，我使用SAX(javax.xml.parsers.SAXParserFactory)实现了这个，我想从平台检索SAXParserFactory。我看到OSGi标准提供了XMLParserActivator以允许JAXP…
2025-04-161
如何使用正则表达式提取”==”两边的操作数？
Howtoextracttheoperandsonbothsidesof"=="usingregex?语言和包python3.8，正则表达式描述输入和想要的输出如下：if(programWorkflowState.getTerminal(1,2)==Boolean.TRUE){想要：programWorkflowState.getTerminal(1,2)和Boolean.TRUEbooleani…
2024-11-201
从 HTML 到 XHTML 的转换会更改欧元符号，从而阻止正确的 XML 解析
ConversionfromHTMLtoXHTMLchangeseurosymbol,preventingcorrectXMLparsing我正在从HTML文件中提取信息，方法是使用Java中的SAX对其进行解析。解析程序给了我，它已经在使用SAX，所以我想保持这种方式。我要做的是：我从网站获取HTML文件使用JTidy库将其转换为有效的XML。然而，这个库将所有€符号转换为"您遇到的问题是编码问…
2024-11-181
在令牌流中解析上下文无关语言
Parsingcontext-freelanguagesinastreamoftokens问题给定具有任意规则和标记流的上下文无关文法，如何有效识别匹配文法的流片段？例子：语法S->ASB|ABA->aB->baabaaabbc...S->ASB|ABA->aB->bS'->S|GS'|S'GS'|S'GG->sigma*(所以本质上，多个as后跟相…
2024-11-171
如何从单词列表中制作 Haskell 解析器？
HowcanImakeaHaskellparserfromalistofwords?我是Haskell初学者，使用Attoparsec在文本中查找一些颜色表达式。例如，我希望能够匹配文本中的"浅蓝绿色"和"浅蓝绿色"。但当然，我需要一个针对任何这样的字符串的通用解决方案。所以我一直在想它会像"light">>sep>>"blue">>sep>>"gr…
2024-11-161
Tab 完成和部分完成
TabCompletionandPartialCompletion我想做一个程序，它以类似于Linux上的ip的方式接受命令。例如，我想要一个完整的showinterfaceoptions命令，但用户可以只输入showinoptions甚至只输入sio如果它们与其他命令不冲突。我对如何解决这个问题有一些想法，我想在C中执行此操作。所以问题是什么是解决此问题的好方法，同时在Linux/UNIX系统之…
2024-11-161
PEGJS:如何将 NOT (!) 逻辑运算符添加到解析 AND (
PEGJS:HowtoaddNOT(!)logicaloperatortogrammarthatparsesAND(&&)OR(||)logicstatements我对编写语法非常陌生(确切地说是第一次)，我想创建一个可以为基本逻辑语句返回AST的语法。到目前为止，我有一个可以处理AND、OR逻辑的语法(我只是修改了官方pegjs网站上的基本计算器示例)。以下是语法当前的作用：声明…
2024-11-161
ANTLR4 如何根据规则更改隐藏字符？
ANTLR4howdochangehiddencharactersbasedonrule?我正在尝试解析结构错误的输入文件，因为通常会跳过换行符，但在某些情况下它用于终止语句，因此有时必须匹配它。然而在这种情况下，换行符似乎成为一般的正常标记，不能被跳过。为了说明我的问题，请考虑以下语法：text:(line'\')+;line:(ID)+|'('ID*')';ID:[a-zA-Z]+;WS:[\…
2024-10-231
使用简单的 html dom 解析器通过每个元素的两个或多个属性来查找部分
Findingpartwithsimplehtmldomparserbytwoormoreattributesperoneelement我想说，我知道，很多人认为，简单的HTMLDOM解析器对于HTML解析器来说是一个非常糟糕的选择。我现在仍然需要使用它。我阅读了一些文章，其中描述了如何通过每个元素的两个或多个属性进行搜索。他们提出了类似的东西和数组过滤的一种可能性foreach(tag[attr…
2024-10-111
Python — 解析文件(docx、pdf 和 odt)并将内容转换为我的数据模型
Python--Parsingfiles(docx,pdfandodt)andconvertingthecontentintomydatamodel我正在编写一个导入/导出工具，用于导入docx、pdf和odt文件；其中写了一本书。我们已经有了一个用于.epub格式的工具，并且我们希望在此基础上扩展功能，以便该网站的用户可以拥有更大的灵活性。到目前为止，我查看了PDFMiner，还发现docx只是…
2024-08-091
Parsec-Parser 工作正常，但能做得更好吗？
Parsec-Parserworksalright,butcoulditbedonebetter?我尝试这样做：以如下形式解析文本：SomeText#{0,0,0}someText#{0,0,0}#{0,0,0}moreText#{0,0,0}变成一些数据结构的列表：[Inside"SomeText",Outside(0,0,0),Inside"someText",Outside(0,0,0),O…
2024-08-031