ruby样本数据处理1

关于我的论文课题。
目前实验在预处理数据阶段,关于瓦斯预警系统的实现。
原始数据为access存储的一年的数据。是KJ70系统所用到的处理数据。
里面的格式是一个库里有一个月每天的数据,以及这一个月里的报警情况。
昨天试了一下用matlab不太适应。上手不快,所以数据预处理放在ruby里实现,得到学习样本,然后放到matlab里训练网络模型。
 
----基本思路是这样。
下面跟ruby处理数据库的方法。
 
 
首先是用ODBC连接数据库。ruby里面已经集成了DBI了,所以直接:
require 'DBI'

  conn = DBI.connect('DBI:ODBC:01','elite','system_project')

  current_tables=conn.tables
  rs = conn.select_all('SELECT * FROM TABLE')
可以根据current_tables.class和rs.class看到这两个变量都是array型的。下面的操作就比较简单了。
 整个原始数据的处理代码:
require 'DBI'
  conn = DBI.connect('DBI:ODBC:01','elite','system_project')
  current_tables=conn.tables

def get_column_names(connection,table_name)
  connection.columns(table_name).collect { |i| i.name  }
end

columns=get_column_names(conn,'01')
column_time=columns[0]
column_position=columns[1]
column_equip=columns[2]
column_data=columns[3]

def process_date(timestamp,tablename)
  str=timestamp.to_s
  arr=str.split(" ")
  year=2006
  month=1
  day=tablename.to_i
  t=arr[1].split('.')[0].split(':')
  hour=t[0].to_i
  min=t[1].to_i
  sec=t[2].to_i
  (day-1)*24*60*60+hour*60*60+min*60+sec
end

def update_time(arr,month)
  arr.each do |elem|
    elem[0]=process_date(elem[0],month)
  end
  arr.sort_by{|x| x[0]}
end

month=nil
gas_rs=wind_rs=tpt_rs=co_rs=prs_rs=Array.new
(1..2).each do |i|
  if i<10
    month="0"+i.to_s
  else
    month=i.to_s
  end
  gm=conn.select_all("select #{column_time},#{column_data} from #{month} where #{column_position}=21")
  wm=conn.select_all("select #{column_time},#{column_data} from #{month} where #{column_position}=22")
  tm=conn.select_all("select #{column_time},#{column_data} from #{month} where #{column_position}=25")
  cm=conn.select_all("select #{column_time},#{column_data} from #{month} where #{column_position}=26")
  pm=conn.select_all("select #{column_time},#{column_data} from #{month} where #{column_position}=4")
  #update database 01 time attribute
   gas_rs.push(update_time(gm,month.to_i))
   wind_rs.push(update_time(wm,month.to_i))
   tpt_rs.push(update_time(tm,month.to_i))
   co_rs.push(update_time(cm,month.to_i))
   prs_rs.push(update_time(pm,month.to_i))
end


def create_seq(gas,wind,tpt,co,prs)
  value=Array.new
  (0..gas.length-2).to_a.each do |i|
    value[i]=[gas[i][0],gas[i][1],wind[i][1],tpt[i][1],co[i][1],prs[i][1]]
  end
  value
end


seq1= create_seq(gas_rs,wind_rs,tpt_rs,co_rs,prs_rs).sort


 msq = DBI.connect('DBI:ODBC:seq','root','')


msq.do("CREATE TABLE seq1 (
             time INT  NOT NULL primary key,
             gas float NOT NULL,
             wind_speed FLOAT,
             temperature FLOAT,
             carbon_monoxide FLOAT,
             air_pressure FLOAT)")


 msq.do("INSERT INTO seq1 (time,gas,wind_speed,temperature,carbon_monoxide,air_pressure)
                  VALUES
                    (#{seq1[0]},#{seq1[1].to_f},#{seq1[2].to_f},#{seq1[3].to_f},#{seq1[4].to_f})
                    ")

 msq.do("INSERT INTO seq1 (time)
                  VALUES
                    (#{seq1[0].to_i})
                    ")


(0..seq1.length-1).each do |i|
   msq.do("INSERT INTO seq1 (time,gas,wind_speed,temperature,carbon_monoxide,air_pressure)
                  VALUES
                    (#{seq1[i][0]},#{seq1[i][1]},#{seq1[i][2]},#{seq1[i][3]},#{seq1[i][4]},#{seq1[i][5]})
                    ")
end

按照KJ70采集的数据,第一个月17天内的各种数据变化图:
瓦斯浓度序列图
 ruby样本数据处理1
 
风速序列图
ruby样本数据处理1
 
 
温度序列图
 
ruby样本数据处理1
负压序列图
 
ruby样本数据处理1
一氧化碳序列图:
 
 ruby样本数据处理1
 




本文转自 fsjoy1983 51CTO博客,原文链接:http://blog.51cto.com/fsjoy/213230,如需转载请自行联系原作者
上一篇:2020年阿里云618活动全攻略


下一篇:《Python Cookbook(第3版)中文版》——1.20 将多个映射合并为单个映射