298 lines
16 KiB
Python
298 lines
16 KiB
Python
# -*- coding: utf-8 -*-
|
|
|
|
from benedict import benedict as bdict
|
|
|
|
import unittest
|
|
|
|
|
|
class stackoverflow_questions_test_case(unittest.TestCase):
|
|
|
|
def test_stackoverflow_question_58692636(self):
|
|
"""
|
|
https://stackoverflow.com/questions/58692636/python-script-fails-to-extract-data-from-xml/58695393#58695393
|
|
"""
|
|
data_xml = """
|
|
<feed xml:base="http://data.treasury.gov/Feed.svc/">
|
|
<title type="text">DailyTreasuryYieldCurveRateData</title>
|
|
<id>
|
|
http://data.treasury.gov/feed.svc/DailyTreasuryYieldCurveRateData
|
|
</id>
|
|
<updated>2019-11-04T07:15:32Z</updated>
|
|
<link rel="self" title="DailyTreasuryYieldCurveRateData" href="DailyTreasuryYieldCurveRateData"/>
|
|
<entry>
|
|
<id>
|
|
http://data.treasury.gov/Feed.svc/DailyTreasuryYieldCurveRateData(7258)
|
|
</id>
|
|
<title type="text"/>
|
|
<updated>2019-11-04T07:15:32Z</updated>
|
|
<author>
|
|
<name/>
|
|
</author>
|
|
<link rel="edit" title="DailyTreasuryYieldCurveRateDatum" href="DailyTreasuryYieldCurveRateData(7258)"/>
|
|
<category term="TreasuryDataWarehouseModel.DailyTreasuryYieldCurveRateDatum" scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme"/>
|
|
<content type="application/xml">
|
|
<m:properties>
|
|
<d:Id m:type="Edm.Int32">7258</d:Id>
|
|
<d:NEW_DATE m:type="Edm.DateTime">2019-01-02T00:00:00</d:NEW_DATE>
|
|
<d:BC_1MONTH m:type="Edm.Double">2.4</d:BC_1MONTH>
|
|
<d:BC_2MONTH m:type="Edm.Double">2.4</d:BC_2MONTH>
|
|
<d:BC_3MONTH m:type="Edm.Double">2.42</d:BC_3MONTH>
|
|
<d:BC_6MONTH m:type="Edm.Double">2.51</d:BC_6MONTH>
|
|
<d:BC_1YEAR m:type="Edm.Double">2.6</d:BC_1YEAR>
|
|
<d:BC_2YEAR m:type="Edm.Double">2.5</d:BC_2YEAR>
|
|
<d:BC_3YEAR m:type="Edm.Double">2.47</d:BC_3YEAR>
|
|
<d:BC_5YEAR m:type="Edm.Double">2.49</d:BC_5YEAR>
|
|
<d:BC_7YEAR m:type="Edm.Double">2.56</d:BC_7YEAR>
|
|
<d:BC_10YEAR m:type="Edm.Double">2.66</d:BC_10YEAR>
|
|
<d:BC_20YEAR m:type="Edm.Double">2.83</d:BC_20YEAR>
|
|
<d:BC_30YEAR m:type="Edm.Double">2.97</d:BC_30YEAR>
|
|
<d:BC_30YEARDISPLAY m:type="Edm.Double">2.97</d:BC_30YEARDISPLAY>
|
|
</m:properties>
|
|
</content>
|
|
</entry>
|
|
<entry>
|
|
<id>
|
|
http://data.treasury.gov/Feed.svc/DailyTreasuryYieldCurveRateData(7259)
|
|
</id>
|
|
<title type="text"/>
|
|
<updated>2019-11-04T07:15:32Z</updated>
|
|
<author>
|
|
<name/>
|
|
</author>
|
|
<link rel="edit" title="DailyTreasuryYieldCurveRateDatum" href="DailyTreasuryYieldCurveRateData(7259)"/>
|
|
<category term="TreasuryDataWarehouseModel.DailyTreasuryYieldCurveRateDatum" scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme"/>
|
|
<content type="application/xml">
|
|
<m:properties>
|
|
<d:Id m:type="Edm.Int32">7259</d:Id>
|
|
<d:NEW_DATE m:type="Edm.DateTime">2019-01-03T00:00:00</d:NEW_DATE>
|
|
<d:BC_1MONTH m:type="Edm.Double">2.42</d:BC_1MONTH>
|
|
<d:BC_2MONTH m:type="Edm.Double">2.42</d:BC_2MONTH>
|
|
<d:BC_3MONTH m:type="Edm.Double">2.41</d:BC_3MONTH>
|
|
<d:BC_6MONTH m:type="Edm.Double">2.47</d:BC_6MONTH>
|
|
<d:BC_1YEAR m:type="Edm.Double">2.5</d:BC_1YEAR>
|
|
<d:BC_2YEAR m:type="Edm.Double">2.39</d:BC_2YEAR>
|
|
<d:BC_3YEAR m:type="Edm.Double">2.35</d:BC_3YEAR>
|
|
<d:BC_5YEAR m:type="Edm.Double">2.37</d:BC_5YEAR>
|
|
<d:BC_7YEAR m:type="Edm.Double">2.44</d:BC_7YEAR>
|
|
<d:BC_10YEAR m:type="Edm.Double">2.56</d:BC_10YEAR>
|
|
<d:BC_20YEAR m:type="Edm.Double">2.75</d:BC_20YEAR>
|
|
<d:BC_30YEAR m:type="Edm.Double">2.92</d:BC_30YEAR>
|
|
<d:BC_30YEARDISPLAY m:type="Edm.Double">2.92</d:BC_30YEARDISPLAY>
|
|
</m:properties>
|
|
</content>
|
|
</entry>
|
|
<entry>
|
|
<id>
|
|
http://data.treasury.gov/Feed.svc/DailyTreasuryYieldCurveRateData(7260)
|
|
</id>
|
|
<title type="text"/>
|
|
<updated>2019-11-04T07:15:32Z</updated>
|
|
<author>
|
|
<name/>
|
|
</author>
|
|
<link rel="edit" title="DailyTreasuryYieldCurveRateDatum" href="DailyTreasuryYieldCurveRateData(7260)"/>
|
|
<category term="TreasuryDataWarehouseModel.DailyTreasuryYieldCurveRateDatum" scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme"/>
|
|
<content type="application/xml">
|
|
<m:properties>
|
|
<d:Id m:type="Edm.Int32">7260</d:Id>
|
|
<d:NEW_DATE m:type="Edm.DateTime">2019-01-04T00:00:00</d:NEW_DATE>
|
|
<d:BC_1MONTH m:type="Edm.Double">2.4</d:BC_1MONTH>
|
|
<d:BC_2MONTH m:type="Edm.Double">2.42</d:BC_2MONTH>
|
|
<d:BC_3MONTH m:type="Edm.Double">2.42</d:BC_3MONTH>
|
|
<d:BC_6MONTH m:type="Edm.Double">2.51</d:BC_6MONTH>
|
|
<d:BC_1YEAR m:type="Edm.Double">2.57</d:BC_1YEAR>
|
|
<d:BC_2YEAR m:type="Edm.Double">2.5</d:BC_2YEAR>
|
|
<d:BC_3YEAR m:type="Edm.Double">2.47</d:BC_3YEAR>
|
|
<d:BC_5YEAR m:type="Edm.Double">2.49</d:BC_5YEAR>
|
|
<d:BC_7YEAR m:type="Edm.Double">2.56</d:BC_7YEAR>
|
|
<d:BC_10YEAR m:type="Edm.Double">2.67</d:BC_10YEAR>
|
|
<d:BC_20YEAR m:type="Edm.Double">2.83</d:BC_20YEAR>
|
|
<d:BC_30YEAR m:type="Edm.Double">2.98</d:BC_30YEAR>
|
|
<d:BC_30YEARDISPLAY m:type="Edm.Double">2.98</d:BC_30YEARDISPLAY>
|
|
</m:properties>
|
|
</content>
|
|
</entry>
|
|
</feed>
|
|
"""
|
|
|
|
data = bdict.from_xml(data_xml)
|
|
# print(data.dump())
|
|
entries = data['feed.entry']
|
|
for entry in entries:
|
|
props = bdict(bdict(entry)['content.m:properties'])
|
|
# print(props.dump())
|
|
for key, value in props.items():
|
|
# print(key, value['#text'])
|
|
pass
|
|
# print('-----')
|
|
|
|
def test_stackoverflow_question_58827592(self):
|
|
"""
|
|
https://stackoverflow.com/questions/58827592/is-there-a-way-to-convert-csv-columns-into-hierarchical-relationships
|
|
"""
|
|
data_source = """
|
|
RecordID,kingdom,phylum,class,order,family,genus,species
|
|
1,Animalia,Chordata,Mammalia,Primates,Hominidae,Homo,Homo sapiens
|
|
2,Animalia,Chordata,Mammalia,Carnivora,Canidae,Canis,Canis
|
|
3,Plantae,nan,Magnoliopsida,Brassicales,Brassicaceae,Arabidopsis,Arabidopsis thaliana
|
|
4,Plantae,nan,Magnoliopsida,Fabales,Fabaceae,Phaseoulus,Phaseolus vulgaris
|
|
"""
|
|
data_input = bdict.from_csv(data_source)
|
|
data_output = bdict()
|
|
|
|
ancestors_hierarchy = ['kingdom', 'phylum', 'class', 'order', 'family', 'genus', 'species']
|
|
for value in data_input['values']:
|
|
data_output['.'.join([value[ancestor] for ancestor in ancestors_hierarchy])] = bdict()
|
|
|
|
# print(data_output.dump())
|
|
keypaths = sorted(data_output.keypaths(), key=lambda item: len(item.split('.')), reverse=True)
|
|
|
|
data_output['children'] = []
|
|
def transform_data(d, key, value):
|
|
if isinstance(value, dict):
|
|
value.update({ 'name':key, 'children':[] })
|
|
data_output.traverse(transform_data)
|
|
|
|
for keypath in keypaths:
|
|
target_keypath = '.'.join(keypath.split('.')[:-1] + ['children'])
|
|
data_output[target_keypath].append(data_output.pop(keypath))
|
|
|
|
# print(data_output.dump())
|
|
|
|
def test_stackoverflow_question_59176476(self):
|
|
"""
|
|
https://stackoverflow.com/questions/59176476/in-python-how-to-parse-a-multi-layered-json
|
|
"""
|
|
# data_source = 'http://legis.senado.leg.br/dadosabertos/materia/20050'
|
|
# data = bdict.from_json('http://legis.senado.leg.br/dadosabertos/materia/20050')
|
|
data_source = {
|
|
'DetalheMateria': {
|
|
'@xmlns:xsi': 'http://www.w3.org/2001/XMLSchema-instance',
|
|
'@xsi:noNamespaceSchemaLocation': 'http://legis.senado.leg.br/dadosabertos/dados/DetalheMateriav5.xsd',
|
|
'Metadados': {
|
|
'Versao': '03/12/2019 21:36:18',
|
|
'VersaoServico': '5',
|
|
'DataVersaoServico': '2017-02-01',
|
|
'DescricaoDataSet': 'Dados básicos da matéria, incluindo autoria, norma gerada e outras informações. A partir de fevereiro de 2019, os requerimentos de comissões permanentes passam a ser numerados com a mesma sistemática dos requerimentos das comissões temporárias, seguindo, portanto, o padrão: REQ 99/2019 - SIGLA_COMISSÃO. Dessa forma, para se buscar um requerimento de determinada comissão (com ano a partir de 2019), deve-se informar .../materia/sigla/número/ano?comissao=sigla da comissão.'
|
|
},
|
|
'Materia': {
|
|
'IdentificacaoMateria': {
|
|
'CodigoMateria': '20050',
|
|
'SiglaCasaIdentificacaoMateria': 'SF',
|
|
'NomeCasaIdentificacaoMateria': 'Senado Federal',
|
|
'SiglaSubtipoMateria': 'PLC',
|
|
'DescricaoSubtipoMateria': 'PROJETO DE LEI DA CÂMARA',
|
|
'NumeroMateria': '00035',
|
|
'AnoMateria': '1988',
|
|
'DescricaoObjetivoProcesso': 'Revisora',
|
|
'DescricaoIdentificacaoMateria': 'PLC 35/1988',
|
|
'IndicadorTramitando': 'Não'
|
|
},
|
|
'DadosBasicosMateria': {
|
|
'EmentaMateria': "DECLARA FERIADO NACIONAL O DIA 20 DE NOVEMBRO, ANIVERSARIO DA MORTE \n DE ZUMBI DOS PALMARES, CONSAGRADO PELA COMUNIDADE AFRO-BRASILEIRA \n COMO 'DIA NACIONAL DA CONSCIENCIA NEGRA.' \n ",
|
|
'IndicadorComplementar': 'Não',
|
|
'DataApresentacao': '1987-12-01',
|
|
'DataLeitura': '1987-12-01'
|
|
},
|
|
'Autoria': {
|
|
'Autor': [
|
|
{'NomeAutor': 'Câmara dos Deputados', 'SiglaTipoAutor': 'CAMARA', 'DescricaoTipoAutor': 'Câmara dos Deputados', 'NumOrdemAutor': '1', 'IndicadorOutrosAutores': 'Não'}
|
|
]
|
|
},
|
|
'Iniciativa': {
|
|
'SiglaTipoIniciativa': 'DEPUTADO',
|
|
'DescricaoTipoIniciativa': 'Deputado',
|
|
'DescricaoIniciativa': 'BENEDITA DA SILVA'
|
|
},
|
|
'OrigemMateria': {
|
|
'SiglaCasaOrigem': 'CD',
|
|
'NomeCasaOrigem': 'Câmara dos Deputados'
|
|
},
|
|
'CasaIniciadoraNoLegislativo': {
|
|
'SiglaCasaIniciadora': 'SF',
|
|
'NomeCasaIniciadora': 'Senado Federal'
|
|
},
|
|
'OutrosNumerosDaMateria': {
|
|
'OutroNumeroDaMateria': {
|
|
'IdentificacaoMateria': {
|
|
'SiglaCasaIdentificacaoMateria': 'CD',
|
|
'NomeCasaIdentificacaoMateria': 'Câmara dos Deputados',
|
|
'SiglaSubtipoMateria': 'PL',
|
|
'DescricaoSubtipoMateria': 'PROJETO DE LEI',
|
|
'NumeroMateria': '00293',
|
|
'AnoMateria': '1987'
|
|
},
|
|
'DescricaoTipoNumeracao': 'CasaIniciadora'
|
|
}
|
|
},
|
|
'SituacaoAtual': {
|
|
'Autuacoes': {
|
|
'Autuacao': [
|
|
{
|
|
'NumeroAutuacao': '1',
|
|
'Situacao': {
|
|
'DataSituacao': '1996-01-23',
|
|
'CodigoSituacao': '28',
|
|
'SiglaSituacao': 'ARQVD',
|
|
'DescricaoSituacao': 'ARQUIVADA AO FINAL DA LEGISLATURA'
|
|
},
|
|
'Local': {
|
|
'DataLocal': '1996-01-23',
|
|
'CodigoLocal': '206',
|
|
'TipoLocal': 'A',
|
|
'SiglaCasaLocal': 'SF',
|
|
'NomeCasaLocal': 'Senado Federal',
|
|
'SiglaLocal': 'SSEXP',
|
|
'NomeLocal': 'SUBSECRETARIA DE EXPEDIENTE'
|
|
}
|
|
}
|
|
]
|
|
}
|
|
},
|
|
'OutrasInformacoes': {
|
|
'Servico': [
|
|
{
|
|
'NomeServico': 'EmendaMateria',
|
|
'DescricaoServico': 'Emendas da matéria',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/materia/emendas/20050?v=6'
|
|
},
|
|
{
|
|
'NomeServico': 'MovimentacaoMateria',
|
|
'DescricaoServico': 'Movimentações da matéria, como tramitações, despachos e prazos.\n Evoluções:\n 14/8/2019\n - criada nova Tag "DeliberacoesMPV" para as deliberações de MPV;\n - criada nova Tag "DescricaoItemCalendario" subord',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/materia/movimentacoes/20050?v=6'
|
|
},
|
|
{
|
|
'NomeServico': 'RelatoriaMateria',
|
|
'DescricaoServico': 'Relatoria atual e relatorias encerradas (histórico) da matéria',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/materia/relatorias/20050?v=5'
|
|
},
|
|
{
|
|
'NomeServico': 'TextoMateria',
|
|
'DescricaoServico': 'Textos da matéria. \n Evoluções da versão: \n 28/8/2019 - incluída a tag "AutoriaTexto", sob a tag "Texto".',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/materia/textos/20050?v=5'
|
|
},
|
|
{
|
|
'NomeServico': 'VotacaoMateria',
|
|
'DescricaoServico': 'Votações da matéria',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/materia/votacoes/20050?v=5'
|
|
},
|
|
{
|
|
'NomeServico': 'VotacoesComissao',
|
|
'UrlServico': 'http://legis.senado.leg.br/dadosabertos/votacaoComissao/materia/PLC/00035/1988?v=1'
|
|
}
|
|
]
|
|
},
|
|
'UrlGlossario': 'http://legis.senado.leg.br/dadosabertos/glossario/lista'
|
|
}
|
|
}
|
|
}
|
|
|
|
data = bdict(data_source)
|
|
|
|
# once your url will return a valid json you could just do:
|
|
# data = bdict.from_json('http://legis.senado.leg.br/dadosabertos/materia/20050')
|
|
|
|
author = bdict(data[['DetalheMateria', 'Materia', 'Autoria', 'Autor']][0])
|
|
author_name = author['NomeAutor']
|
|
# print(author_name)
|