GridFS的原理是将大文件分割为多个比较大的块,将每个块作为独立的文档进行存储。
(1)GridFS中的块会被存贮到专用的集合中,默认为fs.chunks;
(2)除了将文件的每一个块单独存储外,还需要将每个文件块的元信息放入一个文档存储,并将这些文档默认集中在fs.files集合中;
例如将foo.txt文档加入到数据库foo中:
1
2
3
4
5
|
[root@localhost ~] # echo "hello world" >foo.txt
[root@localhost ~] # mongofiles -d foo put foo.txt
connected to: 127.0.0.1 added file : { _id: ObjectId( '54b3d62983047a88669bc529' ), filename: "foo.txt" , chunkSize: 261120, uploadDate: new Date(1421071914003), md5: "6f5902ac237024bdd0c176cb93063dc4" , length: 12 }
done !
|
查看相应的集合:
1
2
3
4
5
|
> show collections fs.chunks fs.files system.indexes > |
查看这个文档:
1
2
3
4
5
6
7
8
9
10
11
|
[root@localhost ~] # mongo foo
MongoDB shell version: 2.6.6 connecting to: foo > db.fs.chunks.findOne() { "_id" : ObjectId( "54b51dc15caeb0e1a8722e8d" ),
"files_id" : ObjectId( "54b51dc0c3ab6ae7c08f6028" ),
"n" : 0,
"data" : BinData(0, "aGVsbG8gd29ybGQK" )
} > |
files_id:块所属文件的元信息;
n: 块在文件中的相对位置;
data:块所包含的二进制数据;
1
2
3
4
5
6
7
8
9
10
|
> db.fs.files.findOne() { "_id" : ObjectId( "54b51dc0c3ab6ae7c08f6028" ),
"filename" : "foo.txt" ,
"chunkSize" : 261120,
"uploadDate" : ISODate( "2015-01-13T13:29:37.525Z" ),
"md5" : "6f5902ac237024bdd0c176cb93063dc4" ,
"length" : 12
} > |
_id:文件的唯一ID,跟文件的每个块中的files_id的值是一致的;
length:文件所包含的字节数;
chunkSize:组成文件的每个块的大小,单位是字节;
updateDate:文件被上传到GridFS的时间;
MD5:文件的MD5值,由服务器计算所得;
本文转自 bannerpei 51CTO博客,原文链接:http://blog.51cto.com/281816327/1603698,如需转载请自行联系原作者