excel中后缀为csv和xls有何区别?
excel中后缀为csv和xls,二者区别如下:
1、xls 文件就是Microsoft excel电子表格的文件格式。
2、csv是最通用的一种文件格式,它可以非常容易地被导入各种PC表格及数据库中。
此文件,一行即为数据表的一行。
生成数据表字段用半角逗号隔开。
csv是文本文件,用记事本就能打开,XLS是二进制的文件只有用EXCEL才能打
csv文件是以逗号为分隔符号,将各字段列分离出的一种ASCII文件。
csv(*.csv) 文件格式只能保存活动工作表中的单元格所显示的文本和数值。
工作表中所有的数据行和字符都将保存。
数据列以逗号分隔,每一行数据都以回车符结束。
如果单元格中包含逗号,则该单元格中的内容以双引号引起。
CSV格式是什么?数据类的文件吗?
csv的全称ma-separated value(被逗号分隔的取值);
这种文件格式被广泛地应用于字符处理和数据存储,很多常用的数据集都有这种格式的版本;
编辑软件:
小规模的csv文件用记事本就可以打开编辑,用excel当然也可以;
大规模csv格式的数据集用上面的两种工具非常容易内存溢出,编辑效率也很地下, 下面这种工具比较适合这种情况:
net.nl/s.j.francke/csved/csvedsetup.exe
我编程时要对一个700兆左右的数据集做预处理,试了很多工具,只有用Csved可以顺利导入编辑,很推荐这个^^
希望队你有帮助:)csv是什么东西?
CSV文件及其使用
CSV文件及其使用
在集图的过程中,你肯定会常常听到CSV文件这个词。
那么所谓CSV文件到底是个什么东西呢? 它有什么用处呢?又要如何使用呢?认真读完下面的文字,相信你对CSV会有一个初步的了解。
所谓“CSV”,是Comma Separated Value(逗号分隔值)的英文缩写,通常都是纯文本文件。
下面是一个实际CSV文件中的部分内容,让大家对他有一个感性的认识。
我们选的是Sjojo_Rescan 的CSV文件(Sjojo是ASW-亚洲扫图风的成员之一)。
sj_mino1001.jpg,715282,4FB55FE8,
sj_mino1002.jpg,471289,93203C5C,
sj_mino1003.jpg,451929,C4E80467,
通常CSV文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数据用逗号 来分隔(标准英文逗号)。
一般说来集图用的.CSV文件的格式是这样的:
文件名,文件大小(以字节为单位),CRC校验值,注释(可省略)
sj_mino1001.jpg,715282,4FB55FE8,
| | | |
文件名 文件大小 CRC值 注释(已省略)
如果你的机器上装了Microsoft Excel的话,.csv文件默认是被Excel打开的。
需要注意的是,当你 双击一个.CSV文件,Excel打开它以后即使不做任何的修改,在关闭的时候Excel往往会提示是否要 改成正确的文件格式,这个时候千万记得要选择“否”。
因为Excel认为.CSV 文件中的数字是要用 科学记数法来表示的,而我们要的.CSV文件中的数字是普通的。
如果你选择了“是”的话,Excel
会把CSV文件中所有的数字用科学计数来表示(2.54932E+5这种形式),这个文件就没法用了。
所 以如果你的CSV文件绝大部分都是用在集图上的话,建议把.CSV的默认打开方式改成任意一个文本 编辑器,系统自带的记事本就是个不错的选择。
好,让我们回到CSV文件的格式中来。
见上面,从左到右 sj_mino1001.jpg是文件名,715282 是以字节表示的文件大小。
当文件名中包含逗号的时候,由于逗号在CSV文件中特殊的作用,为了 不至于产生歧义,需要用引号把文件名括起来。
比如 "The Art, Fantasy.jpg",384211,...,.... 接着是一个8位的16进制数字 4FB55FE8,这是文件的CRC32校验值。
整个CSV文件的精髓都在这里。
让我们举个小例子来说明它的意义:Sjojo发布了一张图sj_mino1001.jpg,假设你是从朋友手中拿 到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动过呢?是否无意 中遭到了损坏呢?CRC就是为解决这个问题而存在的。
一般情况下,扫图家每发布了一套图,就同 时放出一个CSV文件(这种CSV通常叫做Official CSV,也就是官方发布的CSV的意思),这个CSV中 的CRC值是用专门的软件通过CRC32算法(常用的CRC算法还有CRC16)对文件运算后生成的一个值, 这个值可用作文件真身的标志。
在绝大多数情况下,如果这个文件在传播过程中无论是大小还是内 容被改动过。
那么,用同样的CRC32算法再对文件进行运算后产生的CRC校验值就完全不一样了。
如 果得出的CRC值是一样的,则完全有理由认为这个文件是真身,没有被改动过。
还有些时候,收来 的图片文件名被改动过了,那么你怎么知道谁是谁呢?这个时候CRC值又起作用了:用专用的软件对图片处理后,可以得到文件的大小和CRC值,然后根据大小和CRC值在CSV中寻找是否有适合的图片。
如果有,就会把图片的名字改成CSV里的。
举个例子,你收到了一张图片,名字是pic0001.jpg,同时你知道这张图片是Sjojo_Rescan这个集子里面的,但是不知道具体是哪一张。
用软件得到它的大小和CRC分别是715282和4FB55FE8,那么软件在CSV文件里找到一行sj_mino1001.jpg,715282,4FB55FE8,大小和CRC都符合,软件就认为这张图片的原名是sj_mino1001.jpg,接着自动把文件的名字改成sj_mino1001.jpg。
改动的不是CSV文件而是图片的文件名。
接下来的是注释和说明,可以省略掉。
需要注意的是注释的后面是没有逗号的,如果要省略注释的话,一定要在CRC值的后面保留一个逗号,否则软件会把CRC值认为是注释的。
相信看完上面的一大堆东西后,你不但对CSV文件有了个大概地了解,对它的用途应该也有些模糊的概念了吧。
我们收集图片往往是通过各种各样不同的渠道,比如从网站上,IRC上,抑或干脆是朋友送的光盘。
在整个的传播过程中,图片有可能遭受到各种各样的非人待遇。
尤其是从网站上收来的图片。
有些时候仅仅是简单的改了一下名字,更多的时候由于很多PLMM站空间有限,常把图片的尺寸缩小,或者把图片文件缩小。
一张1356x588的图被改成了678x294,或者一个四五百K的文件被缩成了几十K都是常有的事。
比较可恶的是,许多网站把原来扫图家的Logo去掉,打上自己网站的Logo。
还有些许搞笑派的玩家,把各种各样的图片移花接木,改头换面。
这些对于一般的看
图娱乐无伤大雅,但是对于集图来说,收到这样的图片是无法容忍的。
如何验明图片的正身,这是扫图家和集图者共同面对的问题。
CSV文件就是为了解决这样的问题而出现的。
CSV文件最早用在简单的数据库里,由于其格式简单,并具备很强的开放性,所以起初被扫图家用作自己图集的标记。
如上面所说的,CSV文件是个纯文本文件,每一行表示一张图片的许多属性。
你在收一套图集时,只要能找到它的CSV文件,用专用的软件校验后,你对该图集的状况就可以了如指掌。
比如这套图一共有多少张,你收到了多少张,哪些是原图,那些是可能被改动过或者损坏了的图片......我们可以把.CSV文件看作一份索引,你不但可以“按图索骥”,还可以检查自己收来的“马子”血统是 否纯正。
CSV文件的来源通常有两种:一种是扫图家自己发布的CSV,一般称作Official CSV。
也就是官方发布的CSV,通常说来是有相当的权威性的。
比较特殊的是亚洲的许多扫图家,除了公开发布的图以外,还有一些私下发布的Special图,或者一些专门送给朋友的图。
加上扫图家不愿意或者不会做CSV,所以他们图集的CSV往往由集图界中一些资深前辈出头来做。
在这种情况下,往往会出现一个图集有好几个版本的CSV文件,并且每个版本之间都有不小的差别。
此时的CSV不仅是验明真身的依据,同时也给了集图者一个希望:即使缺的再多,即使用这个版本csv收全的人再少,一定会有一个人是全的,就是此CSV的作者!集图界前辈LiQing有一句名言:“有CSV就表示一定有图!” 自然而然的,民间现了一些权威的做CSV的玩家。
比如早期的EDZONE,现在依然活跃的OSun,shum,vsam,TE,Paul... 还有偶们COC图盟的WQC
好了,说了那么多,大家可能会问,CSV文件那么好用,到底要怎么用呢?不会要自己手工来检测吧?呵呵,还记得上文中一再出现的“软件”这个字眼吗?有专用的软件可以帮助我们完成这项工作。
常用的软件有The!Checker和The Hunter。
目前这两个软件都有汉化的简体中文版,汉化人是来自北方的snowtank(感谢snowtank )csv是什么文件?
在 CSV 文件中,数据“栏”以逗号分隔,可允许程序通过读取文件为数据重新创建正确的栏结构,并在每次遇到逗号时开始新的一栏。
创建 CSV 文件有许多方法。
最常用的方法是用电子表格程序,如 Microsoft Excel。
在 Microsoft Excel 中,选择“文件”“另存为”,然后在“文件类型”下拉选择框中选择 CSV (逗号分隔) (*.csv)。
大硬盘服务器、存储服务器、Chia矿机。RackNerd,2019年末成立的商家,主要提供各类KVM VPS主机、独立服务器和站群服务器等。当前RackNerd正在促销旗下几款美国大硬盘服务器,位于洛杉矶multacom数据中心,亚洲优化线路,非常适合存储、数据备份等应用场景,双路e5-2640v2,64G内存,56G SSD系统盘,160T SAS数据盘,流量是每月200T,1Gbps带宽,配5...
LayerStack(成立于2017年),当前正在9折促销旗下的云服务器,LayerStack的云服务器采用第 3 代 AMD EPYC™ (霄龙) 处理器,DDR4内存和企业级 PCIe Gen 4 NVMe SSD。数据中心可选中国香港、日本、新加坡和洛杉矶!其中中国香港、日本和新加坡分为国际线路和CN2线路,如果选择CN2线路,价格每月要+3.2美元,付款支持paypal,支付宝,信用卡等!...
ProfitServer怎么样?ProfitServer好不好。ProfitServer是一家成立于2003的主机商家,是ITC控股的一个部门,主要经营的产品域名、SSL证书、虚拟主机、VPS和独立服务器,机房有俄罗斯、新加坡、荷兰、美国、保加利亚,VPS采用的是KVM虚拟架构,硬盘采用纯SSD,而且最大的优势是不限制流量,大公司运营,机器比较稳定,数据中心众多。此次ProfitServer正在对...
csv为你推荐
互联网接入无线路由器怎样接入互联网显示系统电脑开机显示系统错误怎么办u盾证书转款叫我下载U盾证书,是什么意思混乱模式混乱模式的对应一览上海网络维护公司上海有没有专业公司网络维护的啊等保测评机构等级保护测评到底是做什么的?锤子手机发布会视频我如果学习好会遇见长的漂亮而且优秀的人吗?如果我学习好,长的漂亮的人会对我有好感吗?阿里学院首页阿里学院成都站--让成都电子商务的发展势如破竹垂直型网站什么叫垂直媒体 哪些是垂直媒体小时代发布会完整版乐视视频·小时代版是什么捏?
美国虚拟主机购买 未注册域名查询 哈尔滨服务器租用 花生壳域名贝锐 新秒杀 idc评测 cve-2014-6271 国外服务器网站 shopex空间 qq数据库下载 炎黄盛世 169邮箱 域名接入 linux服务器维护 空间合租 常州联通宽带 新睿云 四川电信商城 空间登入 海外空间 更多