Linux 使用 cut 进行文本提取操作
ahcoder 2025-03-07 15:38 10 浏览
简介
Linux 中的 cut 命令是一个命令行实用程序,用于从文件或标准输入中提取文本行的部分。当希望从文件或数据流中提取特定字段或列时,例如处理以逗号分隔或制表符分隔的文件时,它非常有用。
基础语法
cut 命令通过指定分隔符(例如空格、制表符或特定字符)并选择想要显示的列或字段来工作
cut OPTION... [FILE]...
常用选项
- -b, --bytes=LIST:通过指定一个字节、一组字节或一个字节范围进行选择
- -c, --characters=LIST:通过指定一个字符、一组字符或一个字符范围进行选择
- -d, --delimiter=DELIM:指定将用来代替默认“TAB”分隔符的分隔符
- -f, --fields=LIST:仅选择这些字段;还打印任何不包含分隔符的行,除非指定了 -s 选项
- --complement:补充选择。使用此选项时,cut 将显示除所选内容之外的所有字节、字符或字段
- -s, --only-delimited:不打印不包含分隔符的行
- --output-delimiter=STRING:cut 的默认行为是使用输入分隔符作为输出分隔符。此选项允许指定不同的输出分隔符字符串
范围选择
- N:第 N 个字节、字符或字段,从 1 开始计数
- N-:从第 N 个字节、字符或字段到行尾
- N-M:从第 N 到第 M (含) 个字节、字符或字段
- -M:从第一个到第 M 个(含)字节、字符或字段
示例用法
-f:字段选择
此选项用于指定要提取哪些字段。字段由分隔符分隔(通常是制表符或空格,但可以使用 -d 选项指定任何分隔符)。
示例:要从文件中提取第一列和第三列
cut -f 1,3 filename
-d:分隔符
此选项指定分隔字段的分隔符。默认情况下,cut 假定字段由制表符分隔,但可以指定其他分隔符,如逗号、冒号或空格
示例:要从逗号分隔文件 (CSV) 中提取字段
csv文件
Name,Age,Location
Alice,30,New York
Bob,25,Los Angeles
Charlie,35,Boston
cut -d ',' -f 1,3 filename
示例输出
Name,Location
Alice,New York
Bob,Los Angeles
Charlie,Boston
-c:字符选择
这个选项允许从每行中提取特定字符。可以指定要提取的字符位置(或字符范围)
示例:提取每行位置 1 至 5 的字符
cut -c 1-5 filename
-b:字节选择
此选项允许根据字节而不是字符来截断输入。当处理面向字节的数据(例如二进制文件)时,此功能非常有用。
cut -b 1-5 filename
--complement:反向选择
该选项允许补充选择,这意味着它不是选择指定的字段,而是将其排除
示例:排除第一列(字段)并显示其余部分
cut -f 1 --complement filename
-s:禁止使用无分隔符的行
此选项会隐藏不包含分隔符的行。如果想要排除缺少分隔符的行,此选项非常有用
示例:从文件中提取字段并忽略没有分隔符的行
cut -d ',' -f 1 -s filename
提取特定字符
有一个字符串并想提取前 3 个字符
echo "abcdefg" | cut -c 1-3
输出
abc
提取多个字符范围
要提取多个范围的字符(例如,字符 1-3 和 6-8)
echo "abcdefg" | cut -c 1-3,6-8
输出
abcfg
使用 cut 和 ps 列出进程
可以使用 cut 从 ps 命令输出中提取特定信息
例如:提取进程ID和正在运行的进程的命令
ps aux | cut -d ' ' -f 1,11
使用--complement排除字段
要从 passwd 文件中排除第一个字段(用户名)
cut -d ':' -f 1 --complement /etc/passwd
从 ls 的输出中提取特定列
此命令列出了文件和目录,但只输出它们的名称(ls -l 输出中的第 9 列)
ls -l | cut -d ' ' -f 9
获取当前目录中文件的磁盘使用情况
这将仅输出每个文件或目录的大小,不包括路径信息
du -h | cut -f 1
相关推荐
- Linux ntp时钟同步问题(linux ntp同步命令)
-
有时候,操作系统会报linux的ntp时钟错误。从时钟源同步时间超时。我查看了一下ntp的时钟源,发现执行ntpq-p显示超时。执行nslookup时钟服务器域名,发现可以正常解析。执行了n...
- linux服务器同步利器Rsync全介绍(付脚本)
-
1、认识Rsync(remotesynchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。Rsync使用所谓的“Rsync算法”来使本地和远程两个主机之间的文件...
- 如何使用Rsync同步两个网站服务器的内容
-
本头条号每天坚持更新原创干货技术文章,欢迎关注本头条号"Linux学习教程",公众号名称“Linux入门学习教程"。如需学习视频,请复制以下信息到手机浏览器或电脑浏览器上:zc...
- Linux TB级小文件同步备份解决方案
-
在某些电子档案存储的业务系统下,按照业务场景要求,需要将产生的所有电子影像资料永久存储,并支持备份;因为“钞能力”等原因,一般备份存储只有一个节点(即:一个备份存储服务器);这样就要求研发工程师,不...
- CentOS7下使用Lsyncd实现文件实时同步
-
Lsyncd简单介绍Lsyncd使用文件系统事件接口(inotify或fsevents)来监视本地文件和目录的更改。Lsyncd在几秒钟内将这些文件事件整理核对后,然后生成一个或多个进程以将更...
- 如何手动同步Linux系统时间并与互联网时间保持同步?
-
在Linux系统中,正确的时间同步对于许多任务都是至关重要的。一些关键应用程序可能需要准确的时间戳才能正常工作,而一些安全功能也需要确保所有服务器的时间都是准确的。NTP服务可以自动同步系统时间和互...
- Linux服务器Rsync定时同步一键化配置指南
-
1、主从服务器同时安装rsyncopenssh-clientaptupdate&&aptinstall-yrsyncopenssh-client2、主服务器安装好后输入以下命令生成密钥...
- Linux系统如何使用NTPDATE命令设置时间同步
-
简介:咱们在使用Linux系统的时候,常常能发现用了一阵子之后,Linux系统的时间就对不上了。已经知道的情况是,安装Linux的时候选的时区是Asia/Shanghai,可这系统运行了一...
- 开源的Linux文件同步工具有哪些?(linux 文件夹 同步)
-
Linux系统之间经常需要文件同步,一个好的文件同步工具省时省力,这里介绍几款开源的Linux文件同步工具1.rsync:rsync是Linux上一个功能强大的命令行工具,可以在不同的服务器之间同...
- Linux 系统使用 rsync + inotify 实现文件实时同步
-
Linux系统使用rsync+inotify实现文件实时同步简介inotify监控文件的变化后通知rsync进行文件的同步#配置免密登录ssh-keygen-trsaca...
- Linux 远程数据同步工具详解(linux远程同步命令)
-
一、简介1认识Rsync(remotesynchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。Rsync使用所谓的“Rsync算法”来使本地和远程两个主机之...
- 构建基于 Linux 的 NTP 时间同步集群与时间安全防护实战指南
-
一、为什么时间同步对系统如此重要?在分布式系统、数据库复制、消息队列、审计日志、安全认证(如Kerberos)、容器编排等场景中,系统时间一致性是保障正确性与安全性的基础。一旦服务器间时间漂移,可能...
- 每日Linux学习:同步备份工具 rsync
-
rsync是一个用于高效同步文件和目录的工具。它通过仅传输变化的部分(增量传输)来节省时间和带宽,支持本地同步、远程同步(通过SSH),还能保留文件原有权限、时间戳等属性。本文通过几个常用的实例来...
- Chromixium OS 1.0发布 基于Ubuntu发行版
-
Chromixium项目宣布chromixiumOS1发布,一款基于Ubuntu的Linux分支,chromixiumOS试图重新打造一款外观和感觉与ChromeOS相似的完...
- iOS8.0.X~iOS8.1完美越狱!盘古团队出品
-
【巴士速递·移动情报站】最新消息,iOS8.1越狱了!!此次越狱依旧是iOS7时代我国的大神盘古团队带来的,而该次越狱支持最新的iPhone6、iPhone6Plus、iPadAir2和iPad...
- 一周热门
- 最近发表
- 标签列表
-
- linux 远程 (37)
- u盘 linux (32)
- linux 登录 (34)
- linux 路径 (33)
- linux 文件命令 (35)
- linux 是什么 (35)
- linux 界面 (34)
- 查看文件 linux (35)
- linux 语言 (33)
- linux代码 (32)
- linux 查看命令 (33)
- 关闭linux (34)
- root linux (33)
- 删除文件 linux (35)
- linux 主机 (34)
- linux与 (33)
- linux 函数 (35)
- linux .ssh (35)
- cpu linux (35)
- 查看linux 系统 (32)
- linux 防火墙 (33)
- linux 手机 (32)
- linux 镜像 (34)
- linux mac (32)
- linux ip地址 (34)