随机创建train val test 等文件

机器学习训练中把图片集分为train val和test三个集合，这三个集合的占比一般推荐为7：2：1,为了以后方便产生这几个集合特此写了个小程序，由于简单并且注解也比较详尽在此不赘述。#!/usr/bin/python# -*- coding: UTF-8 -*-# 2018/07/11 by DQimport osimport random #随机数包Main...

粼粼淇

2063人浏览 · 2018-08-19 15:03:33

粼粼淇 · 2018-08-19 15:03:33 发布

机器学习训练中把图片集分为train val和test三个集合，这三个集合的占比一般推荐为7：2：1,为了以后方便产生这几个集合特此写了个小程序，由于简单并且注解也比较详尽在此不赘述。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 2018/07/11 by DQ

import os 
import random #随机数包

MainFolder='/home/dq/CodeProject'
TrainValTestFiles={'train':'train.txt','val':'val.txt','trainval':'trainval.txt','test':'test.txt'}#图片集划分文件集合
TrainR=0.7#用于训练的数据量占比
ValR=0.2 #用于验证的数据量占比
PreImNum=100 #数据总量
fileIdLen=6 #图片名字字符数量，不够补0占位

def CreateImIdTxt(ImIdS,FilePath):
	if os.path.exists(FilePath):
		os.remove(FilePath)#保存的文件夹下有同名的文件先删除	
	with open(FilePath,'w') as FId:
		for ImId in ImIdS:
			ImIdStr=str(ImId).zfill(fileIdLen)+'\n'#占位换行
			FId.writelines(ImIdStr) 


ImIdSet=range(1,PreImNum+1)#图片名标记从1开始
random.shuffle(ImIdSet)#随机打乱这个集合
ImNum=len(ImIdSet)
TrainNum=int(TrainR*ImNum)#用于训练的图片数量
ValNum=int(ValR*ImNum)#用于验证的图片数量

TrainImId=ImIdSet[:TrainNum-1]#从打乱的集合中抽取前TrainNum个数据
TrainImId.sort()#从小到大排序，主要是为了好看
ValImId=ImIdSet[TrainNum:TrainNum+ValNum-1]#从打乱的集合中抽取ValNum个数据
ValImId.sort()
TrainValImId=list(set(TrainImId).union(set(ValImId)))#train和val集合组合成trainval
TrainValImId.sort()
TestImId=(list(set(ImIdSet).difference(set(TrainValImId))))#从总集合中除去trainval就是test
TestImId.sort()
TrainValTestIds={}#把上述集合按字典方式组合在一起
TrainValTestIds['train']=TrainImId
TrainValTestIds['val']=ValImId
TrainValTestIds['trainval']=TrainValImId
TrainValTestIds['test']=TestImId

for Key,KeyVal in TrainValTestFiles.iteritems():#遍历字典产生文件
	ImIdS=TrainValTestIds[Key]
	FileName=TrainValTestFiles[Key]
	FilePath=os.path.join(MainFolder,FileName)
	CreateImIdTxt(ImIdS,FilePath)

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生