社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

Krea 2 开源：12B DiT 文生图双版本 + 九款官方 LoRA集齐发，魔搭 AIGC 专区...

Apache Fory 1.3.0 正式发布：Python Async gRPC 与 Dart gR...

刚刚，OpenAI Codex登陆ChatGPT手机App，所有用户都能用

2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

GitHub开源神器：自建AI聊天站，所有模型一键切换！

【AI加油站】第一百七十一部：读完《深度学习推荐系统》，我整理了这份“避坑指南”与“进化图谱”（附下...

大量 ChatGPT 账号异常，OpenAI 官方称正进调查【AI 早报 2026-06-26】

2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

机器学习学术速递[6.26]

DeepSeek岗位大扩招；OpenAI发布首款AI芯片；豆包公布收费价格｜AIGC周观察第138期

关注

Py学习 » Python

使用python从没有数据名的json文件中提取url

rachid rachid • 6 年前 • 531 次点击

我有一个json文件,其中包含900篇文章的元数据,我想从中提取url。我的文件是这样开始的

[
{
    "title": "The histologic phenotypes of â¦",
    "authors": [
        {
            "name": "JE Armes"
        },
    ],
    "publisher": "Wiley Online Library",
    "article_url": "https://onlinelibrary.wiley.com/doi/abs/10.1002/(SICI)1097-0142(19981201)83:11%3C2335::AID-CNCR13%3E3.0.CO;2-N",
    "cites": 261,
    "use": true
},

{
    "title": "Comparative epidemiology of pemphigus in ...",
    "authors": [
        {
            "name": "S Bastuji-Garin"
        },
        {
            "name": "R Souissi"
        }
        ],
        "year": 1995,
        "publisher": "search.ebscohost.com",
    "article_url": "http://search.ebscohost.com/login.aspx?direct=true&profile=ehost&scope=site&authtype=crawler&jrnl=0022202X&AN=12612836&h=B9CC58JNdE8SYy4M4RyVS%2FrPdlkoZF%2FM5hifWcv%2FwFvGxUCbEaBxwQghRKlK2vLtwY2WrNNl%2B3z%2BiQawA%2BocoA%3D%3D&crl=c",
    "use": true
    },
 .........

我想用 objectpath 为url的extraction创建json.tree。这是我要执行的代码

  1.    import json
  2.    import objectpath
  3.    with open("Data_sample.json") as datafile: data = json.load(datafile)
  4.    jsonnn_tree = objectpath.Tree(data['name of data'])
  5.    result_tuple = tuple(jsonnn_tree.execute('$..article_url'))

但是在创建树的第4步中,我必须插入我认为不在文件中的数据的名称。我怎样才能换这条线?

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/49704

文章 [ 3 ] | 最新文章 6 年前

Reply

• 1 楼

bspeagle 7 年前

您是否尝试删除引用并仅使用:

jsonnn_tree = objectpath.Tree(data)

Reply

• 2 楼

andreihondrari 7 年前

可以这样实例化树:

tobj = op.Tree(your_data)
results = tobj.execute("$.article_url")

最后:

results = [x for x in results]

将产生:

["url1", "url2", ...]

Reply

• 3 楼

Bryan 7 年前

您可以使用列表理解获得所有文章的url。

import json

with open("Data_sample.json") as fh:
    articles = json.load(fh)

article_urls = [article['article_url'] for article in articles]

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号