微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在 OpenRefine 上从此 HTML 中提取国家/地区代码?

如何解决如何在 OpenRefine 上从此 HTML 中提取国家/地区代码?

我是这方面的新手,甚至不知道如何正确引用某些术语,如果我不太擅长解释自己,请见谅。我试图找到一种方法来从我在 OpenRefine 上获得的 HTML 中提取国家代码,在我的例子中是“códigoIso”。我们被要求提取,但没有被告知如何去做,甚至没有暗示使用什么语言,或者 grel 是如何工作的。事实上,我们还没有被解释如何做到这一点。 我到处搜索,但找不到正确的“表达式”,所以我可以解析它,并获得我需要的唯一信息:国家/地区代码的 ISO 值,32。

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"
    xmlns:dbpprop="http://dbpedia.org/property/"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    version="XHTML+RDFa 1.0"
    xml:lang="es"
>


<!-- header -->
<head profile="http://www.w3.org/1999/xhtml/vocab">
    <Meta charset="utf-8" />
    <Meta http-equiv="X-UA-Compatible" content="IE=edge" />
    <Meta name="viewport" content="width=device-width,initial-scale=1.0" />
    <title>About: Argentina</title>
    <link rel="alternate" type="application/rdf+xml"        href="http://es.dbpedia.org/data/Argentina.rdf" title="Structured Descriptor Document (RDF/XML format)" />
    <link rel="alternate" type="text/n3"            href="http://es.dbpedia.org/data/Argentina.n3" title="Structured Descriptor Document (N3 format)" />
    <link rel="alternate" type="text/turtle"            href="http://es.dbpedia.org/data/Argentina.ttl" title="Structured Descriptor Document (Turtle format)" />
    <link rel="alternate" type="application/json+rdf"       href="http://es.dbpedia.org/data/Argentina.jrdf" title="Structured Descriptor Document (RDF/JSON format)" />
    <link rel="alternate" type="application/json"       href="http://es.dbpedia.org/data/Argentina.json" title="Structured Descriptor Document (RDF/JSON format)" />
    <link rel="alternate" type="application/atom+xml"       href="http://es.dbpedia.org/data/Argentina.atom" title="OData (Atom+Feed format)" />
    <link rel="alternate" type="text/plain"             href="http://es.dbpedia.org/data/Argentina.ntriples" title="Structured Descriptor Document (N-Triples format)" />
    <link rel="alternate" type="text/csv"               href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fcsv" title="Structured Descriptor Document (CSV format)" />
    
    <link rel="alternate" type="application/microdata+json" href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=application%2Fmicrodata%2Bjson" title="Structured Descriptor Document (Microdata/JSON format)" />
    <link rel="alternate" type="text/html"          href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fhtml" title="Structured Descriptor Document (Microdata/HTML format)" />
    <link rel="alternate" type="application/ld+json"        href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=application%2Fjson-ld" title="Structured Descriptor Document (JSON-LD format)" />
    <link rel="alternate" type="text/x-html-script-ld+json" href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fx-html-script-ld%2Bjson" title="Structured Descriptor Document (HTML with embedded JSON-LD)" />
    <link rel="alternate" type="text/x-html-script-turtle"  href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fx-html-script-turtle" title="Structured Descriptor Document (HTML with embedded Turtle)" />
    <link rel="timegate" type="text/html"           href="http://dbpedia.mementodepot.org/timegate/http://es.dbpedia.org/page/Argentina" title="Time Machine" />
    <link rel="foaf:primarytopic"               href="http://es.dbpedia.org/resource/Argentina"/>
    <link rev="describedby"                     href="http://es.dbpedia.org/resource/Argentina"/>
    <link rel="stylesheet" type="text/css"          href="/statics/css/bootstrap.min.css" />
    <link rel="stylesheet" type="text/css"          href="/statics/css/dbpedia.css" />
</head>
<body about="http://es.dbpedia.org/resource/Argentina">
<div class="navbar navbar-default navbar-fixed-top">
    <div class="container">
    <div class="navbar-header">
        <button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#dbp-navbar" aria-expanded="false">
        <span class="sr-only">Toggle navigation</span>
        <span class="icon-bar"></span>
        <span class="icon-bar"></span>
        <span class="icon-bar"></span>
        </button>
        <a class="navbar-brand" href="http://es.dbpedia.org" title="About DBpedia" style="color: #2c5078">
        <img class="img-responsive" src="https://i.imgur.com/IeeSN7U.png" alt="About DBpedia" style="display: inline-block;  margin-top: -15px;width:70px;height:49px;"/>
        </a>
            <a class="navbar-brand" href="https://www.upm.es/" title="About UPM" style="color: #2c5078">
        <img class="img-responsive" src="https://www.upm.es/sfs/Rectorado/Gabinete%20del%20Rector/logos/UPM/logotipo%20con%20Leyenda/logoTIPO%20leyenda%20color%20PNG.png" alt="About UPM" style="display: inline-block; margin-top: -20px;width:120px;height:56px;">
        </a>
    </div>

    <div class="collapse navbar-collapse" id="dbp-navbar">
        <ul class="nav navbar-nav navbar-right">
        <li><a class="active" href="/fct/" title="Switch to /fct endpoint"><span class="glyphicon glyphicon-new-window" aria-hidden="true"></span> Faceted browser </a></li>
        <li><a class="active" href="/sparql/" title="Switch to /sparql endpoint"><span class="glyphicon glyphicon-new-window" aria-hidden="true"></span> Sparql Endpoint </a></li>
        </ul>
        <ul class="nav navbar-nav">
        <li class="dropdown">
        <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-haspopup="true" aria-expanded="false"><span class="glyphicon glyphicon-eye-open" aria-hidden="true"></span> browse using <span class="caret"></span></a>
        <ul class="dropdown-menu">
        <li><a href="/describe/?uri=http%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina">OpenLink Faceted browser</a></li>
        <li><a href="http://linkeddata.uriburner.com/rdf-editor/#/editor?uri=http%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina&amp;view=statements">OpenLink Structured Data Editor</a></li>
        <li><a href="http://en.lodlive.it/?http%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina">LodLive browser</a></li>
        <li><a href="http://lodmilla.sztaki.hu/lodmilla/?url=http%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina">LODmilla browser</a></li>
        </ul>
        </li>
        <li class="dropdown">
        <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-haspopup="true" aria-expanded="false"><span class="glyphicon glyphicon-file" aria-hidden="true"></span> Formats <span class="caret"></span></a>
        <ul class="dropdown-menu">
        <li>&nbsp;RDF:</li>
            <li><a href="http://es.dbpedia.org/data/Argentina.ntriples">N-Triples</a></li>
            <li><a href="http://es.dbpedia.org/data/Argentina.n3">N3</a></li>
            <li><a href="http://es.dbpedia.org/data/Argentina.ttl">Turtle</a></li>
            <li><a href="http://es.dbpedia.org/data/Argentina.json">JSON</a></li>
            <li><a href="http://es.dbpedia.org/data/Argentina.rdf">XML</a></li>
        <li class="divider"></li>
        <li>&nbsp;OData:</li>
            <li><a href="http://es.dbpedia.org/data/Argentina.atom">Atom</a></li>
            <li><a href="http://es.dbpedia.org/data/Argentina.jsod">JSON</a></li>
        <li class="divider"></li>
        <li>&nbsp;Microdata:</li>
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=application%2Fmicrodata%2Bjson">JSON</a></li>
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fhtml">HTML</a></li>
        <li class="divider"></li>
        <li>&nbsp;Embedded:</li>
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fx-html-script-ld%2Bjson">JSON</a></li>
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fx-html-script-turtle">Turtle</a></li>
        <li class="divider"></li>
            
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=text%2Fcsv">CSV</a></li>
            <li><a href="http://es.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fes.dbpedia.org&amp;query=DESCRIBE%20%3Chttp%3A%2F%2Fes.dbpedia.org%2Fresource%2FArgentina%3E&amp;format=application%2Fjson-ld">JSON-LD</a></li>
        </ul>
        </li>
        </ul>
    </div>
    </div>
</div>

<div class="container">
<!-- page-header -->
    <div class="page-header">
    <!-- div class="pull-right">
        <a href="http://es.dbpedia.org" title="About DBpedia">
        <img class="img-responsive" src="/statics/images/dbpedia_logo_land_120.png" alt="About DBpedia"/>
        </a>
    </div -->
    <h1 id="title">About:
        <a href="http://es.dbpedia.org/resource/Argentina">Argentina</a>
    </h1>
    <div class="page-resource-uri">
        An Entity of Type : <a href="http://es.dbpedia.org/ontology/Location">Location</a>,from Named Graph : <a href="http://es.dbpedia.org">http://es.dbpedia.org</a>,within Data Space : <a href="http://es.dbpedia.org">es.dbpedia.org</a>
    </div>
    </div>
<!-- page-header -->
<!-- row -->
    <div class="row">
    <div class="col-xs-12">
        <p class="lead">Argentina,oficialmente República Argentina,​ es un país soberano de América del Sur,ubicado en el extremo sur y sudeste de dicho subcontinente. Adopta la forma de gobierno republicana,democrática,representativa y federal. Integra el Mercosur —bloque del que fue fundador en 1991—,la Unión de Naciones Sudamericanas (Unasur),la Comunidad de Estados Latinoamericanos y Caribeños (CELAC) y la Organización de Estados Americanos (OEA).</p>
    </div>
    <div class="col-xs-12">
        <!-- proptable -->
        <table class="description table table-striped">
        <tr>
        <th class="col-xs-3">Property</th>
        <th class="col-xs-9">Value</th>
        </tr>
<tr class="odd"><td class="property"><a class="uri" href="http://es.dbpedia.org/ontology/abstract" title="http://dbpedia.org/ontology/abstract"><small>dbo:</small>abstract</a>
</td><td><ul>

后面有一个很长的部分,包含更多关于国家/地区的信息,但这是 ISO 代码所在的部分。

            <li>
                <span class="literal">
                    <span property="prop-es:códigoIso" xmlns:prop-es="http://es.dbpedia.org/property/">32</span>
                    <small> (xsd:integer)</small>
                </span>
            </li>
        </ul>
    </td>
</tr>
<tr class="even">
    <td class="property">
        <a class="uri" href="http://es.dbpedia.org/property/códigoTelefónico">
            <small>prop-es:</small>códigoTelefónico
        </a>
    </td>
    <td>
        <ul>

我已经尝试了我能找到的关于该主题的所有方法,但不断出现错误,我变得绝望了。

任何帮助将不胜感激。

Ps:感谢您到目前为止的更正!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。