Linux系统网络设备启动和禁止“ifconfig eth0 up/down”命令的跟踪

前面文章讲了Linux系统的ethtool框架的一些东西,是从用户空间可以直观认识到的地方入手。同样,本文从Linux系统绝大部分人都熟悉的“ifconfig eth0 up”命令来跟踪一下此命令在内核中的发生了什么事情。由于ifconfig启动(up)和禁止(down)网络设备很相似,就放到一起讲了。

首先从ifconfig的源码入手,我下载的源码地址是http://www.tazenda.demon.co.uk/phil/net-tools/。这个网站上还有大量很有用的工具的源码,源码分布符合Linux的系统目录,有兴趣的可以去看看。

在我们输入up或down时,对应的代码如下:

main()
{
     if (!strcmp(*spp, "up")) {
         goterr |= set_flag(ifr.ifr_name, (IFF_UP | IFF_RUNNING));
         spp++;
         continue;
     }
     if (!strcmp(*spp, "down")) {
         goterr |= clr_flag(ifr.ifr_name, IFF_UP);
         spp++;
         continue;
     }
}

很简单,就是根据用户的输入来标志IFF_UP参考。当up时,使用set_flag置位IFF_UP和IFF_RUNNING,当down时,使用clr_flag清除IFF_UP。Linux的这种思想值得学习,其实对于内核来讲,真的就是通过IFF_UP标志来判断网卡的使能和禁止的。

来看设置标志的set_flag函数:

static int set_flag(char *ifname, short flag)
{
    struct ifreq ifr;

    safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);
    if (ioctl(skfd, SIOCGIFFLAGS, &ifr) < 0) {
     fprintf(stderr, _("%s: unknown interface: %s\n"),
          ifname,     strerror(errno));
     return (-1);
    }
    safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);
    ifr.ifr_flags |= flag;
    if (ioctl(skfd, SIOCSIFFLAGS, &ifr) < 0) {
     perror("SIOCSIFFLAGS");
     return -1;
    }
    return (0);
}

以及清除标志的clr_flag函数:

static int clr_flag(char *ifname, short flag)
{
    struct ifreq ifr;
    int fd;

    if (strchr(ifname, ':')) {
        /* This is a v4 alias interface.  Downing it via a socket for
        another AF may have bad consequences. */
        fd = get_socket_for_af(AF_INET);
     if (fd < 0) {
         fprintf(stderr, _("No support for INET on this system.\n"));
         return -1;
     }
    } else
        fd = skfd;

    safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);
    if (ioctl(fd, SIOCGIFFLAGS, &ifr) < 0) {
     fprintf(stderr, _("%s: unknown interface: %s\n"),
          ifname, strerror(errno));
     return -1;
    }
    safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);
    ifr.ifr_flags &= ~flag;
    if (ioctl(fd, SIOCSIFFLAGS, &ifr) < 0) {
     perror("SIOCSIFFLAGS");
     return -1;
    }
    return (0);
}

观察这两个函数,最后都是使用SIOCSIFFLAGS命令和内核交互。我们找到这个命令的使用地方,它位于net/core/dev.c文件,如下:

int dev_ioctl(struct net *net, unsigned int cmd, void __user *arg)
{
     case SIOCSIFFLAGS:
     case SIOCSIFMETRIC:
     case SIOCSIFMTU:
     case SIOCSIFMAP:
     case SIOCSIFHWADDR:
     case SIOCSIFSLAVE:
     case SIOCADDMULTI:
     case SIOCDELMULTI:
     case SIOCSIFHWBROADCAST:
     case SIOCSIFTXQLEN:
     case SIOCSMIIREG:
     case SIOCBONDENSLAVE:
     case SIOCBONDRELEASE:
     case SIOCBONDSETHWADDR:
     case SIOCBONDCHANGEACTIVE:
     case SIOCBRADDIF:
     case SIOCBRDELIF:
     case SIOCSHWTSTAMP:
          if (!capable(CAP_NET_ADMIN))
               return -EPERM;
          /* fall through */
     case SIOCBONDSLAVEINFOQUERY:
     case SIOCBONDINFOQUERY:
          dev_load(net, ifr.ifr_name);
          rtnl_lock();
          ret = dev_ifsioc(net, &ifr, cmd);
          rtnl_unlock();
          return ret;
}

SIOCSIFFLAGS会调用到dev_ifsioc函数:

static int dev_ifsioc(struct net *net, struct ifreq *ifr, unsigned int cmd)
{
     switch (cmd) {
     case SIOCSIFFLAGS:     /* Set interface flags */
          return dev_change_flags(dev, ifr->ifr_flags);
}

继续跟进dev_change_flags函数:

int dev_change_flags(struct net_device *dev, unsigned flags)
{
     int ret, changes;
     int old_flags = dev->flags;

     ret = __dev_change_flags(dev, flags); // 打开设备
     if (ret < 0)
          return ret;

     changes = old_flags ^ dev->flags;
     if (changes)
          rtmsg_ifinfo(RTM_NEWLINK, dev, changes); // 暂未了解

     __dev_notify_flags(dev, old_flags); // 向通道链netdev_chain发出通知
     return ret;
}

真正干活的是__dev_change_flags函数:

int __dev_change_flags(struct net_device *dev, unsigned int flags)
{
     if ((old_flags ^ flags) & IFF_UP) {     /* Bit is different  ? */
          ret = ((old_flags & IFF_UP) ? __dev_close : __dev_open)(dev);
}

根据标志选择打开设备__dev_open或关闭__dev_close。在同一文件还有dev_open或dev_close,我发现它们使用了EXPORT_SYMBOL导出,供给其它模块使用,但在这里,是使用了__dev_XX函数的。

打开函数如下:

static int __dev_open(struct net_device *dev)
{
	const struct net_device_ops *ops = dev->netdev_ops;
	int ret;

	ASSERT_RTNL();

	/*
	 *	Is it even present?
	 */
	if (!netif_device_present(dev))
		return -ENODEV;

	ret = call_netdevice_notifiers(NETDEV_PRE_UP, dev);
	ret = notifier_to_errno(ret);
	if (ret)
		return ret;

	/*
	 *	Call device private open method
	 */
	set_bit(__LINK_STATE_START, &dev->state);

	if (ops->ndo_validate_addr)
		ret = ops->ndo_validate_addr(dev);

	if (!ret && ops->ndo_open)
		ret = ops->ndo_open(dev);

	/*
	 *	If it went open OK then:
	 */

	if (ret)
		clear_bit(__LINK_STATE_START, &dev->state);

	return ret;
}

在真正调用具体驱动的接口前,先发NETDEV_PRE_UP给到通知链,再置__LINK_STATE_START,然后才调用驱动的ndo_open接口,最后需要清除__LINK_STATE_START标志。当ndo_open接口调用返回非0(即失败)时,需要清除__LINK_STATE_START标志,因为在调用之前已经置位了该标志,如此一来,才是有始有终。最后返回具体驱动接口的返回值。 (2019.6.26:感谢网友Tiger指正)

关闭函数如下:

static int __dev_close(struct net_device *dev)
{
	const struct net_device_ops *ops = dev->netdev_ops;

	ASSERT_RTNL();
	might_sleep();

	/*
	 *	Tell people we are going down, so that they can
	 *	prepare to death, when device is still operating.
	 */
	call_netdevice_notifiers(NETDEV_GOING_DOWN, dev);

	clear_bit(__LINK_STATE_START, &dev->state);

	/* Synchronize to scheduled poll. We cannot touch poll list,
	 * it can be even on different cpu. So just clear netif_running().
	 *
	 * dev->stop() will invoke napi_disable() on all of it's
	 * napi_struct instances on this device.
	 */
	smp_mb__after_clear_bit(); /* Commit netif_running(). */

	dev_deactivate(dev);

	/*
	 *	Call the device specific close. This cannot fail.
	 *	Only if device is UP
	 *
	 *	We allow it to be called even after a DETACH hot-plug
	 *	event.
	 */
	if (ops->ndo_stop)
		ops->ndo_stop(dev);

	/*
	 *	Device is now down.
	 */

	dev->flags &= ~IFF_UP;

	return 0;
}

在真正调用具体驱动的接口前,先发NETDEV_GOING_DOWN给到通知链,表示网络设备准备挂了,再清除__LINK_STATE_START标志,然后才调用驱动的ndo_stop接口,最后需要清除IFF_UP。

经过内核的层层结构,条条框框,终于到了具体的驱动了,上面的函数使用的接口实际上是net_device_ops结构体的函数指针,还是以igb驱动为例,赋值如下:

static const struct net_device_ops igb_netdev_ops = {
	.ndo_open		= igb_open,
	.ndo_stop		= igb_close,
	.ndo_start_xmit		= igb_xmit_frame_adv,
	.ndo_get_stats64	= igb_get_stats64,
	.ndo_set_rx_mode	= igb_set_rx_mode,
	.ndo_set_multicast_list	= igb_set_rx_mode,
	.ndo_set_mac_address	= igb_set_mac,
	.ndo_change_mtu		= igb_change_mtu,
	.ndo_do_ioctl		= igb_ioctl,
	.ndo_tx_timeout		= igb_tx_timeout,
	.ndo_validate_addr	= eth_validate_addr,
	.ndo_vlan_rx_register	= igb_vlan_rx_register,
	.ndo_vlan_rx_add_vid	= igb_vlan_rx_add_vid,
	.ndo_vlan_rx_kill_vid	= igb_vlan_rx_kill_vid,
	.ndo_set_vf_mac		= igb_ndo_set_vf_mac,
	.ndo_set_vf_vlan	= igb_ndo_set_vf_vlan,
	.ndo_set_vf_tx_rate	= igb_ndo_set_vf_bw,
	.ndo_get_vf_config	= igb_ndo_get_vf_config,
#ifdef CONFIG_NET_POLL_CONTROLLER
	.ndo_poll_controller	= igb_netpoll,
#endif
};

我们看到最开始的2个函数就是打开和关闭。在igb_probe函数对igb_netdev_ops进行赋值:

netdev->netdev_ops = &igb_netdev_ops;

至此,整个过程分析完毕。

文中涉及到通知链,网络设备通知链netdev_chain,这个还没研究过,这里简单列一下:

// 声明通知链表
static RAW_NOTIFIER_HEAD(netdev_chain);

//注册
int register_netdevice_notifier(struct notifier_block *nb)
{
raw_notifier_chain_register(&netdev_chain, nb);
}

注销:
int unregister_netdevice_notifier(struct notifier_block *nb)
{
     int err;
     err = raw_notifier_chain_unregister(&netdev_chain, nb);
}

31号的PS:

写完后想一想,感觉没到分析彻底,因为到具体的驱动后干了些什么还没跟踪,于是又花了点时间跟踪一下。我跟踪的是ti的网卡驱动,主要实现代码在cpsw.c文件,在http://lxr.oss.org.cn/source/drivers/net/ethernet/ti/?v=3.17可以找到。下面列出启动网卡时的过程的重要函数调用:

   > cpsw_ndo_open
   > cpsw_slave_open
      > phy_connect (传递cpsw_adjust_link)
         > phy_connect_direct (PHY_READY)
         >  phy_prepare_link (赋值cpsw_adjust_link为adjust_link)
         > phy_start_machine
     > phy_start (PHY_READY变成PHY_UP)

phy_start之后进入了phy驱动重要的状态判断函数phy_state_machine,phy驱动有一个工作队列就是调用这个函数的,这个函数判断了网络各种状态:PHY_DOWN、PHY_UPPHY_AN、PHY_NOLINK,等,并做出对应的动作。我们设置了PHY_UP,则函数过程如下:

phy_state_machine
 > phy_start_aneg
  > config_aneg
  > genphy_config_aneg(实际上是这个函数,由phy驱动赋值的)

到了genphy_config_aneg这个函数,就是直接和phy芯片打交道了,读phy寄存器、写phy寄存器。默认情况下会进行自动协商(其实就是写phy的第0个寄存器),当然,如果不是,即phy_device成员变量autoneg是AUTONEG_DISABLE,则会强制设置指定的速率、双工模式。

 


至此,就不再继续分析、跟踪了。

2015.3.30 李迟

文件为doc版,可自行转成txt,在手机上看挺好。 本资源来自网络,如有纰漏还请告知,如觉得还不错,请留言告知后来人,谢谢!!!!! 入门学习Linux常用必会60命令实例详解 Linux必学60命令 Linux提供了大量命令,利用它可以有效地完成大量工作,如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等。所以,在Linux系统上工作离不开使用系统提供命令。要想真正理解Linux系统,就必须从Linux命令学起,通过基础命令学习可以进一步理解Linux系统。 不同Linux发行版命令数量不一样,但Linux发行版本最少命令也有200多个。这里笔者把比较重要使用频率最多命令,按照它们在系统作用分成下面六个部分一一介绍。 ◆ 安装登录命令:login、shutdown、halt、reboot、install、mount、umount、chsh、exit、last; ◆ 文件处理命令:file、mkdir、grep、dd、find、mv、ls、diff、cat、ln; ◆ 系统管理相关命令:df、top、free、quota、at、lp、adduser、groupadd、kill、crontab; ◆ 网络操作命令ifconfig、ip、ping、netstat、telnet、ftp、route、rlogin、rcp、finger、mail、 nslookup; ◆ 系统安全相关命令:passwd、su、umask、chgrp、chmod、chown、chattr、sudo ps、who; ◆ 其它命令:tar、unzip、gunzip、unarj、mtools、man、unendcode、uudecode。 本文以Mandrake Linux 9.1(Kenrel 2.4.21)为例,介绍Linux安装登录命令。 immortality按:请用ctrl+f在本页中查找某一部分内容或某一命令用法。 -------------------------------------------------------------------------------- Linux必学60命令(1)-安装与登陆命令 login 1.作用 login作用是登录系统,它使用权限是所有用户。 2.格式 login [name][-p ][-h 主机名称] 3.主要参数 -p:通知login保持现在环境参数。 -h:用来向远程登录之间传输用户名。 如果选择用命令行模式登录Linux话,那么看到第一个Linux命令就是login:。 一般界面是这样: Manddrake Linux release 9.1(Bamboo) for i586 renrel 2.4.21-0.13mdk on i686 / tty1 localhost login:root password: 上面代码中,第一行是Linux发行版本号,第二行是内核版本号登录虚拟控制台,我们在第三行输入登录名,按“Enter”键在Password后输入账户密码,即可登录系统。出于安全考虑,输入账户密码时字符不会在屏幕上回显,光标也不移动。 登录后会看到下面这个界面(以超级用户为例): [root@localhost root]# last login:Tue ,Nov 18 10:00:55 on vc/1 上面显示是登录星期、月、日、时间使用虚拟控制台。 4.应用技巧 Linux 是一个真正多用户操作系统,可以同时接受多个用户登录,还允许一个用户进行多次登录。这是因为Linux许多版本Unix一样,提供了虚拟控制台访问方式,允许用户在同一时间从控制台(系统控制台是与系统直接相连监视器键盘)进行多次登录。每个虚拟控制台可以看作是一个独立工作站,工作台之间可以切换。虚拟控制台切换可以通过按下Alt键一个功能键来实现,通常使用F1-F6 。 例如,用户登录后,按一下“Alt+ F2”键,用户就可以看到上面出现“login:”提示符,说明用户看到了第二个虚拟控制台。然后只需按“Alt+ F1”键,就可以回到第一个虚拟控制台。一个新安装Linux系统允许用户使用“Alt+F1”到“Alt+F6”键来访问前六个虚拟控制台。虚拟控制台最有用是,当一个程序出错造成系统死锁时,可以切换到其它虚拟控制台工作,关闭这个程序。 shutdown 1.作用 shutdown命令作用是关闭计算机,它使用权限是超级用户。 2.格式 shutdown [-h][-i][-k][-m][-t] 3.重要参数 -t:在改变到其它运行级别之前,
相关推荐
©️2020 CSDN 皮肤主题: 技术工厂 设计师:CSDN官方博客 返回首页