为了能够训练赋值黏贴篡改检测网络,我们需要建立一个复制黏贴篡改数据集,为了简单起见,我们使用coco数据集来进行构建。
第一步,建立json文件文件
这里我为了能够按照自己的思路写程序,将coco的json文件格式做了点修改,代码如下
import json
import time
"""
file = open("instances_val2017.json", "r")
img_info = json.load(file)
print(img_info.keys())
tmp_dict = {}
tmp_dict["categories"] = img_info["categories"][:2]
tmp_dict = json.dumps(tmp_dict, indent=4)
"""
#tmp_dict = json.loads(tmp_dict)
#print(tmp_dict)
#img_info = json.dumps(img_info, indent=4)
#print(img_info)
# 获取类别信息
# 第一个返回值是列表
# 第二个返回值是字典
def get_cate():
file = open("instances_val2017.json", "r")
img_info = json.load(file)
tmp_dict = {}
tmp_dict["categories"] = img_info["categories"]
#tmp_dict = json.dumps(tmp_dict, indent=4)
list = tmp_dict["categories"]
cate = []
# 第一个位置是背景
cate.append("background")
cate_dict = {}
for item in list:
cate.append(item["name"])
cate_dict[item["name"]] = item["id"]
print(cate)
print(cate_dict)
return cate, cate_dict
""""""""""""""""""""""""""""
我自定义的数据格式
{
"images":{
"(file_name)":{
"height": int,
"width": int,
"id": int,
"annotation": {
"segmentation":[
[
int,
int,
...
]
],
"iscrowd": int,
"bbox":[
int,
int,
int,
int
],
"category_id": int,
}
}
}
}
算法步骤:
1.找出所有的filename和对应的id
2.对于每张图片,找寻他的所有标注信息
"""""""""""""""""""""""""""""""""""
def get_info(read_file, dump_file):
# 保存信息的字典
img_anno = {}
img_anno["images"] = {}
file = open(read_file, "r")
img_info = json.load(file)
tmp_dict = {}
tmp_dict["images"] &#