Branch data Line data Source code
1 : : // SPDX-License-Identifier: GPL-2.0-or-later
2 : : /*
3 : : * INET An implementation of the TCP/IP protocol suite for the LINUX
4 : : * operating system. INET is implemented using the BSD Socket
5 : : * interface as the means of communication with the user level.
6 : : *
7 : : * IPv4 Forwarding Information Base: semantics.
8 : : *
9 : : * Authors: Alexey Kuznetsov, <kuznet@ms2.inr.ac.ru>
10 : : */
11 : :
12 : : #include <linux/uaccess.h>
13 : : #include <linux/bitops.h>
14 : : #include <linux/types.h>
15 : : #include <linux/kernel.h>
16 : : #include <linux/jiffies.h>
17 : : #include <linux/mm.h>
18 : : #include <linux/string.h>
19 : : #include <linux/socket.h>
20 : : #include <linux/sockios.h>
21 : : #include <linux/errno.h>
22 : : #include <linux/in.h>
23 : : #include <linux/inet.h>
24 : : #include <linux/inetdevice.h>
25 : : #include <linux/netdevice.h>
26 : : #include <linux/if_arp.h>
27 : : #include <linux/proc_fs.h>
28 : : #include <linux/skbuff.h>
29 : : #include <linux/init.h>
30 : : #include <linux/slab.h>
31 : : #include <linux/netlink.h>
32 : :
33 : : #include <net/arp.h>
34 : : #include <net/ip.h>
35 : : #include <net/protocol.h>
36 : : #include <net/route.h>
37 : : #include <net/tcp.h>
38 : : #include <net/sock.h>
39 : : #include <net/ip_fib.h>
40 : : #include <net/ip6_fib.h>
41 : : #include <net/nexthop.h>
42 : : #include <net/netlink.h>
43 : : #include <net/rtnh.h>
44 : : #include <net/lwtunnel.h>
45 : : #include <net/fib_notifier.h>
46 : : #include <net/addrconf.h>
47 : :
48 : : #include "fib_lookup.h"
49 : :
50 : : static DEFINE_SPINLOCK(fib_info_lock);
51 : : static struct hlist_head *fib_info_hash;
52 : : static struct hlist_head *fib_info_laddrhash;
53 : : static unsigned int fib_info_hash_size;
54 : : static unsigned int fib_info_cnt;
55 : :
56 : : #define DEVINDEX_HASHBITS 8
57 : : #define DEVINDEX_HASHSIZE (1U << DEVINDEX_HASHBITS)
58 : : static struct hlist_head fib_info_devhash[DEVINDEX_HASHSIZE];
59 : :
60 : : /* for_nexthops and change_nexthops only used when nexthop object
61 : : * is not set in a fib_info. The logic within can reference fib_nh.
62 : : */
63 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
64 : :
65 : : #define for_nexthops(fi) { \
66 : : int nhsel; const struct fib_nh *nh; \
67 : : for (nhsel = 0, nh = (fi)->fib_nh; \
68 : : nhsel < fib_info_num_path((fi)); \
69 : : nh++, nhsel++)
70 : :
71 : : #define change_nexthops(fi) { \
72 : : int nhsel; struct fib_nh *nexthop_nh; \
73 : : for (nhsel = 0, nexthop_nh = (struct fib_nh *)((fi)->fib_nh); \
74 : : nhsel < fib_info_num_path((fi)); \
75 : : nexthop_nh++, nhsel++)
76 : :
77 : : #else /* CONFIG_IP_ROUTE_MULTIPATH */
78 : :
79 : : /* Hope, that gcc will optimize it to get rid of dummy loop */
80 : :
81 : : #define for_nexthops(fi) { \
82 : : int nhsel; const struct fib_nh *nh = (fi)->fib_nh; \
83 : : for (nhsel = 0; nhsel < 1; nhsel++)
84 : :
85 : : #define change_nexthops(fi) { \
86 : : int nhsel; \
87 : : struct fib_nh *nexthop_nh = (struct fib_nh *)((fi)->fib_nh); \
88 : : for (nhsel = 0; nhsel < 1; nhsel++)
89 : :
90 : : #endif /* CONFIG_IP_ROUTE_MULTIPATH */
91 : :
92 : : #define endfor_nexthops(fi) }
93 : :
94 : :
95 : : const struct fib_prop fib_props[RTN_MAX + 1] = {
96 : : [RTN_UNSPEC] = {
97 : : .error = 0,
98 : : .scope = RT_SCOPE_NOWHERE,
99 : : },
100 : : [RTN_UNICAST] = {
101 : : .error = 0,
102 : : .scope = RT_SCOPE_UNIVERSE,
103 : : },
104 : : [RTN_LOCAL] = {
105 : : .error = 0,
106 : : .scope = RT_SCOPE_HOST,
107 : : },
108 : : [RTN_BROADCAST] = {
109 : : .error = 0,
110 : : .scope = RT_SCOPE_LINK,
111 : : },
112 : : [RTN_ANYCAST] = {
113 : : .error = 0,
114 : : .scope = RT_SCOPE_LINK,
115 : : },
116 : : [RTN_MULTICAST] = {
117 : : .error = 0,
118 : : .scope = RT_SCOPE_UNIVERSE,
119 : : },
120 : : [RTN_BLACKHOLE] = {
121 : : .error = -EINVAL,
122 : : .scope = RT_SCOPE_UNIVERSE,
123 : : },
124 : : [RTN_UNREACHABLE] = {
125 : : .error = -EHOSTUNREACH,
126 : : .scope = RT_SCOPE_UNIVERSE,
127 : : },
128 : : [RTN_PROHIBIT] = {
129 : : .error = -EACCES,
130 : : .scope = RT_SCOPE_UNIVERSE,
131 : : },
132 : : [RTN_THROW] = {
133 : : .error = -EAGAIN,
134 : : .scope = RT_SCOPE_UNIVERSE,
135 : : },
136 : : [RTN_NAT] = {
137 : : .error = -EINVAL,
138 : : .scope = RT_SCOPE_NOWHERE,
139 : : },
140 : : [RTN_XRESOLVE] = {
141 : : .error = -EINVAL,
142 : : .scope = RT_SCOPE_NOWHERE,
143 : : },
144 : : };
145 : :
146 : 3 : static void rt_fibinfo_free(struct rtable __rcu **rtp)
147 : : {
148 : 3 : struct rtable *rt = rcu_dereference_protected(*rtp, 1);
149 : :
150 : 3 : if (!rt)
151 : 3 : return;
152 : :
153 : : /* Not even needed : RCU_INIT_POINTER(*rtp, NULL);
154 : : * because we waited an RCU grace period before calling
155 : : * free_fib_info_rcu()
156 : : */
157 : :
158 : 1 : dst_dev_put(&rt->dst);
159 : 1 : dst_release_immediate(&rt->dst);
160 : : }
161 : :
162 : 3 : static void free_nh_exceptions(struct fib_nh_common *nhc)
163 : : {
164 : : struct fnhe_hash_bucket *hash;
165 : : int i;
166 : :
167 : 3 : hash = rcu_dereference_protected(nhc->nhc_exceptions, 1);
168 : 3 : if (!hash)
169 : 3 : return;
170 : 0 : for (i = 0; i < FNHE_HASH_SIZE; i++) {
171 : : struct fib_nh_exception *fnhe;
172 : :
173 : 0 : fnhe = rcu_dereference_protected(hash[i].chain, 1);
174 : 0 : while (fnhe) {
175 : : struct fib_nh_exception *next;
176 : :
177 : 0 : next = rcu_dereference_protected(fnhe->fnhe_next, 1);
178 : :
179 : 0 : rt_fibinfo_free(&fnhe->fnhe_rth_input);
180 : 0 : rt_fibinfo_free(&fnhe->fnhe_rth_output);
181 : :
182 : 0 : kfree(fnhe);
183 : :
184 : : fnhe = next;
185 : : }
186 : : }
187 : 0 : kfree(hash);
188 : : }
189 : :
190 : 3 : static void rt_fibinfo_free_cpus(struct rtable __rcu * __percpu *rtp)
191 : : {
192 : : int cpu;
193 : :
194 : 3 : if (!rtp)
195 : 3 : return;
196 : :
197 : 3 : for_each_possible_cpu(cpu) {
198 : : struct rtable *rt;
199 : :
200 : 3 : rt = rcu_dereference_protected(*per_cpu_ptr(rtp, cpu), 1);
201 : 3 : if (rt) {
202 : 1 : dst_dev_put(&rt->dst);
203 : 1 : dst_release_immediate(&rt->dst);
204 : : }
205 : : }
206 : 3 : free_percpu(rtp);
207 : : }
208 : :
209 : 3 : void fib_nh_common_release(struct fib_nh_common *nhc)
210 : : {
211 : 3 : if (nhc->nhc_dev)
212 : 3 : dev_put(nhc->nhc_dev);
213 : :
214 : : lwtstate_put(nhc->nhc_lwtstate);
215 : 3 : rt_fibinfo_free_cpus(nhc->nhc_pcpu_rth_output);
216 : 3 : rt_fibinfo_free(&nhc->nhc_rth_input);
217 : 3 : free_nh_exceptions(nhc);
218 : 3 : }
219 : : EXPORT_SYMBOL_GPL(fib_nh_common_release);
220 : :
221 : 0 : void fib_nh_release(struct net *net, struct fib_nh *fib_nh)
222 : : {
223 : : #ifdef CONFIG_IP_ROUTE_CLASSID
224 : 3 : if (fib_nh->nh_tclassid)
225 : 0 : net->ipv4.fib_num_tclassid_users--;
226 : : #endif
227 : 3 : fib_nh_common_release(&fib_nh->nh_common);
228 : 0 : }
229 : :
230 : : /* Release a nexthop info record */
231 : 3 : static void free_fib_info_rcu(struct rcu_head *head)
232 : : {
233 : 3 : struct fib_info *fi = container_of(head, struct fib_info, rcu);
234 : :
235 : 3 : if (fi->nh) {
236 : 0 : nexthop_put(fi->nh);
237 : : } else {
238 : 3 : change_nexthops(fi) {
239 : 3 : fib_nh_release(fi->fib_net, nexthop_nh);
240 : : } endfor_nexthops(fi);
241 : : }
242 : :
243 : 3 : ip_fib_metrics_put(fi->fib_metrics);
244 : :
245 : 3 : kfree(fi);
246 : 3 : }
247 : :
248 : 3 : void free_fib_info(struct fib_info *fi)
249 : : {
250 : 3 : if (fi->fib_dead == 0) {
251 : 0 : pr_warn("Freeing alive fib_info %p\n", fi);
252 : 3 : return;
253 : : }
254 : 3 : fib_info_cnt--;
255 : :
256 : 3 : call_rcu(&fi->rcu, free_fib_info_rcu);
257 : : }
258 : : EXPORT_SYMBOL_GPL(free_fib_info);
259 : :
260 : 3 : void fib_release_info(struct fib_info *fi)
261 : : {
262 : : spin_lock_bh(&fib_info_lock);
263 : 3 : if (fi && --fi->fib_treeref == 0) {
264 : : hlist_del(&fi->fib_hash);
265 : 1 : if (fi->fib_prefsrc)
266 : : hlist_del(&fi->fib_lhash);
267 : 1 : if (fi->nh) {
268 : : list_del(&fi->nh_list);
269 : : } else {
270 : 1 : change_nexthops(fi) {
271 : 1 : if (!nexthop_nh->fib_nh_dev)
272 : 0 : continue;
273 : : hlist_del(&nexthop_nh->nh_hash);
274 : : } endfor_nexthops(fi)
275 : : }
276 : 1 : fi->fib_dead = 1;
277 : 1 : fib_info_put(fi);
278 : : }
279 : : spin_unlock_bh(&fib_info_lock);
280 : 3 : }
281 : :
282 : 3 : static inline int nh_comp(struct fib_info *fi, struct fib_info *ofi)
283 : : {
284 : : const struct fib_nh *onh;
285 : :
286 : 3 : if (fi->nh || ofi->nh)
287 : 0 : return nexthop_cmp(fi->nh, ofi->nh) ? 0 : -1;
288 : :
289 : 3 : if (ofi->fib_nhs == 0)
290 : : return 0;
291 : :
292 : 3 : for_nexthops(fi) {
293 : : onh = fib_info_nh(ofi, nhsel);
294 : :
295 : 3 : if (nh->fib_nh_oif != onh->fib_nh_oif ||
296 : 3 : nh->fib_nh_gw_family != onh->fib_nh_gw_family ||
297 : 3 : nh->fib_nh_scope != onh->fib_nh_scope ||
298 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
299 : 3 : nh->fib_nh_weight != onh->fib_nh_weight ||
300 : : #endif
301 : : #ifdef CONFIG_IP_ROUTE_CLASSID
302 : 3 : nh->nh_tclassid != onh->nh_tclassid ||
303 : : #endif
304 : 3 : lwtunnel_cmp_encap(nh->fib_nh_lws, onh->fib_nh_lws) ||
305 : 3 : ((nh->fib_nh_flags ^ onh->fib_nh_flags) & ~RTNH_COMPARE_MASK))
306 : : return -1;
307 : :
308 : 3 : if (nh->fib_nh_gw_family == AF_INET &&
309 : 0 : nh->fib_nh_gw4 != onh->fib_nh_gw4)
310 : : return -1;
311 : :
312 : 3 : if (nh->fib_nh_gw_family == AF_INET6 &&
313 : 0 : ipv6_addr_cmp(&nh->fib_nh_gw6, &onh->fib_nh_gw6))
314 : : return -1;
315 : : } endfor_nexthops(fi);
316 : : return 0;
317 : : }
318 : :
319 : : static inline unsigned int fib_devindex_hashfn(unsigned int val)
320 : : {
321 : : unsigned int mask = DEVINDEX_HASHSIZE - 1;
322 : :
323 : 3 : return (val ^
324 : 3 : (val >> DEVINDEX_HASHBITS) ^
325 : 3 : (val >> (DEVINDEX_HASHBITS * 2))) & mask;
326 : : }
327 : :
328 : : static unsigned int fib_info_hashfn_1(int init_val, u8 protocol, u8 scope,
329 : : u32 prefsrc, u32 priority)
330 : : {
331 : 3 : unsigned int val = init_val;
332 : :
333 : 3 : val ^= (protocol << 8) | scope;
334 : 3 : val ^= prefsrc;
335 : 3 : val ^= priority;
336 : :
337 : : return val;
338 : : }
339 : :
340 : : static unsigned int fib_info_hashfn_result(unsigned int val)
341 : : {
342 : 3 : unsigned int mask = (fib_info_hash_size - 1);
343 : :
344 : 3 : return (val ^ (val >> 7) ^ (val >> 12)) & mask;
345 : : }
346 : :
347 : 3 : static inline unsigned int fib_info_hashfn(struct fib_info *fi)
348 : : {
349 : : unsigned int val;
350 : :
351 : 3 : val = fib_info_hashfn_1(fi->fib_nhs, fi->fib_protocol,
352 : : fi->fib_scope, (__force u32)fi->fib_prefsrc,
353 : : fi->fib_priority);
354 : :
355 : 3 : if (fi->nh) {
356 : 0 : val ^= fib_devindex_hashfn(fi->nh->id);
357 : : } else {
358 : 3 : for_nexthops(fi) {
359 : 3 : val ^= fib_devindex_hashfn(nh->fib_nh_oif);
360 : : } endfor_nexthops(fi)
361 : : }
362 : :
363 : 3 : return fib_info_hashfn_result(val);
364 : : }
365 : :
366 : : /* no metrics, only nexthop id */
367 : 0 : static struct fib_info *fib_find_info_nh(struct net *net,
368 : : const struct fib_config *cfg)
369 : : {
370 : : struct hlist_head *head;
371 : : struct fib_info *fi;
372 : : unsigned int hash;
373 : :
374 : 0 : hash = fib_info_hashfn_1(fib_devindex_hashfn(cfg->fc_nh_id),
375 : : cfg->fc_protocol, cfg->fc_scope,
376 : : (__force u32)cfg->fc_prefsrc,
377 : : cfg->fc_priority);
378 : : hash = fib_info_hashfn_result(hash);
379 : 0 : head = &fib_info_hash[hash];
380 : :
381 : 0 : hlist_for_each_entry(fi, head, fib_hash) {
382 : 0 : if (!net_eq(fi->fib_net, net))
383 : 0 : continue;
384 : 0 : if (!fi->nh || fi->nh->id != cfg->fc_nh_id)
385 : 0 : continue;
386 : 0 : if (cfg->fc_protocol == fi->fib_protocol &&
387 : 0 : cfg->fc_scope == fi->fib_scope &&
388 : 0 : cfg->fc_prefsrc == fi->fib_prefsrc &&
389 : 0 : cfg->fc_priority == fi->fib_priority &&
390 : 0 : cfg->fc_type == fi->fib_type &&
391 : 0 : cfg->fc_table == fi->fib_tb_id &&
392 : 0 : !((cfg->fc_flags ^ fi->fib_flags) & ~RTNH_COMPARE_MASK))
393 : 0 : return fi;
394 : : }
395 : :
396 : : return NULL;
397 : : }
398 : :
399 : 3 : static struct fib_info *fib_find_info(struct fib_info *nfi)
400 : : {
401 : : struct hlist_head *head;
402 : : struct fib_info *fi;
403 : : unsigned int hash;
404 : :
405 : 3 : hash = fib_info_hashfn(nfi);
406 : 3 : head = &fib_info_hash[hash];
407 : :
408 : 3 : hlist_for_each_entry(fi, head, fib_hash) {
409 : 3 : if (!net_eq(fi->fib_net, nfi->fib_net))
410 : 0 : continue;
411 : 3 : if (fi->fib_nhs != nfi->fib_nhs)
412 : 0 : continue;
413 : 3 : if (nfi->fib_protocol == fi->fib_protocol &&
414 : 3 : nfi->fib_scope == fi->fib_scope &&
415 : 3 : nfi->fib_prefsrc == fi->fib_prefsrc &&
416 : 3 : nfi->fib_priority == fi->fib_priority &&
417 : 3 : nfi->fib_type == fi->fib_type &&
418 : 3 : memcmp(nfi->fib_metrics, fi->fib_metrics,
419 : 3 : sizeof(u32) * RTAX_MAX) == 0 &&
420 : 3 : !((nfi->fib_flags ^ fi->fib_flags) & ~RTNH_COMPARE_MASK) &&
421 : 3 : nh_comp(fi, nfi) == 0)
422 : 3 : return fi;
423 : : }
424 : :
425 : : return NULL;
426 : : }
427 : :
428 : : /* Check, that the gateway is already configured.
429 : : * Used only by redirect accept routine.
430 : : */
431 : 0 : int ip_fib_check_default(__be32 gw, struct net_device *dev)
432 : : {
433 : : struct hlist_head *head;
434 : : struct fib_nh *nh;
435 : : unsigned int hash;
436 : :
437 : : spin_lock(&fib_info_lock);
438 : :
439 : 0 : hash = fib_devindex_hashfn(dev->ifindex);
440 : : head = &fib_info_devhash[hash];
441 : 0 : hlist_for_each_entry(nh, head, nh_hash) {
442 : 0 : if (nh->fib_nh_dev == dev &&
443 : 0 : nh->fib_nh_gw4 == gw &&
444 : 0 : !(nh->fib_nh_flags & RTNH_F_DEAD)) {
445 : : spin_unlock(&fib_info_lock);
446 : 0 : return 0;
447 : : }
448 : : }
449 : :
450 : : spin_unlock(&fib_info_lock);
451 : :
452 : 0 : return -1;
453 : : }
454 : :
455 : 3 : static inline size_t fib_nlmsg_size(struct fib_info *fi)
456 : : {
457 : : size_t payload = NLMSG_ALIGN(sizeof(struct rtmsg))
458 : : + nla_total_size(4) /* RTA_TABLE */
459 : : + nla_total_size(4) /* RTA_DST */
460 : : + nla_total_size(4) /* RTA_PRIORITY */
461 : : + nla_total_size(4) /* RTA_PREFSRC */
462 : : + nla_total_size(TCP_CA_NAME_MAX); /* RTAX_CC_ALGO */
463 : : unsigned int nhs = fib_info_num_path(fi);
464 : :
465 : : /* space for nested metrics */
466 : : payload += nla_total_size((RTAX_MAX * nla_total_size(4)));
467 : :
468 : 3 : if (fi->nh)
469 : : payload += nla_total_size(4); /* RTA_NH_ID */
470 : :
471 : 3 : if (nhs) {
472 : : size_t nh_encapsize = 0;
473 : : /* Also handles the special case nhs == 1 */
474 : :
475 : : /* each nexthop is packed in an attribute */
476 : : size_t nhsize = nla_total_size(sizeof(struct rtnexthop));
477 : : unsigned int i;
478 : :
479 : : /* may contain flow and gateway attribute */
480 : : nhsize += 2 * nla_total_size(4);
481 : :
482 : : /* grab encap info */
483 : 3 : for (i = 0; i < fib_info_num_path(fi); i++) {
484 : 3 : struct fib_nh_common *nhc = fib_info_nhc(fi, i);
485 : :
486 : 3 : if (nhc->nhc_lwtstate) {
487 : : /* RTA_ENCAP_TYPE */
488 : : nh_encapsize += lwtunnel_get_encap_size(
489 : : nhc->nhc_lwtstate);
490 : : /* RTA_ENCAP */
491 : 0 : nh_encapsize += nla_total_size(2);
492 : : }
493 : : }
494 : :
495 : : /* all nexthops are packed in a nested attribute */
496 : 3 : payload += nla_total_size((nhs * nhsize) + nh_encapsize);
497 : :
498 : : }
499 : :
500 : 3 : return payload;
501 : : }
502 : :
503 : 3 : void rtmsg_fib(int event, __be32 key, struct fib_alias *fa,
504 : : int dst_len, u32 tb_id, const struct nl_info *info,
505 : : unsigned int nlm_flags)
506 : : {
507 : : struct sk_buff *skb;
508 : 3 : u32 seq = info->nlh ? info->nlh->nlmsg_seq : 0;
509 : : int err = -ENOBUFS;
510 : :
511 : 3 : skb = nlmsg_new(fib_nlmsg_size(fa->fa_info), GFP_KERNEL);
512 : 3 : if (!skb)
513 : : goto errout;
514 : :
515 : 3 : err = fib_dump_info(skb, info->portid, seq, event, tb_id,
516 : : fa->fa_type, key, dst_len,
517 : : fa->fa_tos, fa->fa_info, nlm_flags);
518 : 3 : if (err < 0) {
519 : : /* -EMSGSIZE implies BUG in fib_nlmsg_size() */
520 : 0 : WARN_ON(err == -EMSGSIZE);
521 : 0 : kfree_skb(skb);
522 : 0 : goto errout;
523 : : }
524 : 3 : rtnl_notify(skb, info->nl_net, info->portid, RTNLGRP_IPV4_ROUTE,
525 : : info->nlh, GFP_KERNEL);
526 : 3 : return;
527 : : errout:
528 : 0 : if (err < 0)
529 : 0 : rtnl_set_sk_err(info->nl_net, RTNLGRP_IPV4_ROUTE, err);
530 : : }
531 : :
532 : 0 : static int fib_detect_death(struct fib_info *fi, int order,
533 : : struct fib_info **last_resort, int *last_idx,
534 : : int dflt)
535 : : {
536 : 0 : const struct fib_nh_common *nhc = fib_info_nhc(fi, 0);
537 : : struct neighbour *n;
538 : : int state = NUD_NONE;
539 : :
540 : 0 : if (likely(nhc->nhc_gw_family == AF_INET))
541 : 0 : n = neigh_lookup(&arp_tbl, &nhc->nhc_gw.ipv4, nhc->nhc_dev);
542 : 0 : else if (nhc->nhc_gw_family == AF_INET6)
543 : 0 : n = neigh_lookup(ipv6_stub->nd_tbl, &nhc->nhc_gw.ipv6,
544 : : nhc->nhc_dev);
545 : : else
546 : : n = NULL;
547 : :
548 : 0 : if (n) {
549 : 0 : state = n->nud_state;
550 : 0 : neigh_release(n);
551 : : } else {
552 : : return 0;
553 : : }
554 : 0 : if (state == NUD_REACHABLE)
555 : : return 0;
556 : 0 : if ((state & NUD_VALID) && order != dflt)
557 : : return 0;
558 : 0 : if ((state & NUD_VALID) ||
559 : 0 : (*last_idx < 0 && order > dflt && state != NUD_INCOMPLETE)) {
560 : 0 : *last_resort = fi;
561 : 0 : *last_idx = order;
562 : : }
563 : : return 1;
564 : : }
565 : :
566 : 3 : int fib_nh_common_init(struct fib_nh_common *nhc, struct nlattr *encap,
567 : : u16 encap_type, void *cfg, gfp_t gfp_flags,
568 : : struct netlink_ext_ack *extack)
569 : : {
570 : : int err;
571 : :
572 : 3 : nhc->nhc_pcpu_rth_output = alloc_percpu_gfp(struct rtable __rcu *,
573 : : gfp_flags);
574 : 3 : if (!nhc->nhc_pcpu_rth_output)
575 : : return -ENOMEM;
576 : :
577 : 3 : if (encap) {
578 : : struct lwtunnel_state *lwtstate;
579 : :
580 : 0 : if (encap_type == LWTUNNEL_ENCAP_NONE) {
581 : 0 : NL_SET_ERR_MSG(extack, "LWT encap type not specified");
582 : : err = -EINVAL;
583 : : goto lwt_failure;
584 : : }
585 : : err = lwtunnel_build_state(encap_type, encap, nhc->nhc_family,
586 : : cfg, &lwtstate, extack);
587 : : if (err)
588 : : goto lwt_failure;
589 : :
590 : : nhc->nhc_lwtstate = lwtstate_get(lwtstate);
591 : : }
592 : :
593 : : return 0;
594 : :
595 : : lwt_failure:
596 : 0 : rt_fibinfo_free_cpus(nhc->nhc_pcpu_rth_output);
597 : 0 : nhc->nhc_pcpu_rth_output = NULL;
598 : 0 : return err;
599 : : }
600 : : EXPORT_SYMBOL_GPL(fib_nh_common_init);
601 : :
602 : 3 : int fib_nh_init(struct net *net, struct fib_nh *nh,
603 : : struct fib_config *cfg, int nh_weight,
604 : : struct netlink_ext_ack *extack)
605 : : {
606 : : int err;
607 : :
608 : 3 : nh->fib_nh_family = AF_INET;
609 : :
610 : 3 : err = fib_nh_common_init(&nh->nh_common, cfg->fc_encap,
611 : : cfg->fc_encap_type, cfg, GFP_KERNEL, extack);
612 : 3 : if (err)
613 : : return err;
614 : :
615 : 3 : nh->fib_nh_oif = cfg->fc_oif;
616 : 3 : nh->fib_nh_gw_family = cfg->fc_gw_family;
617 : 3 : if (cfg->fc_gw_family == AF_INET)
618 : 3 : nh->fib_nh_gw4 = cfg->fc_gw4;
619 : 3 : else if (cfg->fc_gw_family == AF_INET6)
620 : 0 : nh->fib_nh_gw6 = cfg->fc_gw6;
621 : :
622 : 3 : nh->fib_nh_flags = cfg->fc_flags;
623 : :
624 : : #ifdef CONFIG_IP_ROUTE_CLASSID
625 : 3 : nh->nh_tclassid = cfg->fc_flow;
626 : 3 : if (nh->nh_tclassid)
627 : 0 : net->ipv4.fib_num_tclassid_users++;
628 : : #endif
629 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
630 : 3 : nh->fib_nh_weight = nh_weight;
631 : : #endif
632 : 3 : return 0;
633 : : }
634 : :
635 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
636 : :
637 : 0 : static int fib_count_nexthops(struct rtnexthop *rtnh, int remaining,
638 : : struct netlink_ext_ack *extack)
639 : : {
640 : : int nhs = 0;
641 : :
642 : 0 : while (rtnh_ok(rtnh, remaining)) {
643 : 0 : nhs++;
644 : : rtnh = rtnh_next(rtnh, &remaining);
645 : : }
646 : :
647 : : /* leftover implies invalid nexthop configuration, discard it */
648 : 0 : if (remaining > 0) {
649 : 0 : NL_SET_ERR_MSG(extack,
650 : : "Invalid nexthop configuration - extra data after nexthops");
651 : : nhs = 0;
652 : : }
653 : :
654 : 0 : return nhs;
655 : : }
656 : :
657 : : /* only called when fib_nh is integrated into fib_info */
658 : 0 : static int fib_get_nhs(struct fib_info *fi, struct rtnexthop *rtnh,
659 : : int remaining, struct fib_config *cfg,
660 : : struct netlink_ext_ack *extack)
661 : : {
662 : 0 : struct net *net = fi->fib_net;
663 : : struct fib_config fib_cfg;
664 : : struct fib_nh *nh;
665 : : int ret;
666 : :
667 : 0 : change_nexthops(fi) {
668 : : int attrlen;
669 : :
670 : 0 : memset(&fib_cfg, 0, sizeof(fib_cfg));
671 : :
672 : 0 : if (!rtnh_ok(rtnh, remaining)) {
673 : 0 : NL_SET_ERR_MSG(extack,
674 : : "Invalid nexthop configuration - extra data after nexthop");
675 : : return -EINVAL;
676 : : }
677 : :
678 : 0 : if (rtnh->rtnh_flags & (RTNH_F_DEAD | RTNH_F_LINKDOWN)) {
679 : 0 : NL_SET_ERR_MSG(extack,
680 : : "Invalid flags for nexthop - can not contain DEAD or LINKDOWN");
681 : : return -EINVAL;
682 : : }
683 : :
684 : 0 : fib_cfg.fc_flags = (cfg->fc_flags & ~0xFF) | rtnh->rtnh_flags;
685 : 0 : fib_cfg.fc_oif = rtnh->rtnh_ifindex;
686 : :
687 : : attrlen = rtnh_attrlen(rtnh);
688 : 0 : if (attrlen > 0) {
689 : : struct nlattr *nla, *nlav, *attrs = rtnh_attrs(rtnh);
690 : :
691 : 0 : nla = nla_find(attrs, attrlen, RTA_GATEWAY);
692 : 0 : nlav = nla_find(attrs, attrlen, RTA_VIA);
693 : 0 : if (nla && nlav) {
694 : 0 : NL_SET_ERR_MSG(extack,
695 : : "Nexthop configuration can not contain both GATEWAY and VIA");
696 : : return -EINVAL;
697 : : }
698 : 0 : if (nla) {
699 : 0 : fib_cfg.fc_gw4 = nla_get_in_addr(nla);
700 : 0 : if (fib_cfg.fc_gw4)
701 : 0 : fib_cfg.fc_gw_family = AF_INET;
702 : 0 : } else if (nlav) {
703 : 0 : ret = fib_gw_from_via(&fib_cfg, nlav, extack);
704 : 0 : if (ret)
705 : : goto errout;
706 : : }
707 : :
708 : 0 : nla = nla_find(attrs, attrlen, RTA_FLOW);
709 : 0 : if (nla)
710 : 0 : fib_cfg.fc_flow = nla_get_u32(nla);
711 : :
712 : 0 : fib_cfg.fc_encap = nla_find(attrs, attrlen, RTA_ENCAP);
713 : 0 : nla = nla_find(attrs, attrlen, RTA_ENCAP_TYPE);
714 : 0 : if (nla)
715 : 0 : fib_cfg.fc_encap_type = nla_get_u16(nla);
716 : : }
717 : :
718 : 0 : ret = fib_nh_init(net, nexthop_nh, &fib_cfg,
719 : 0 : rtnh->rtnh_hops + 1, extack);
720 : 0 : if (ret)
721 : : goto errout;
722 : :
723 : : rtnh = rtnh_next(rtnh, &remaining);
724 : : } endfor_nexthops(fi);
725 : :
726 : : ret = -EINVAL;
727 : : nh = fib_info_nh(fi, 0);
728 : 0 : if (cfg->fc_oif && nh->fib_nh_oif != cfg->fc_oif) {
729 : 0 : NL_SET_ERR_MSG(extack,
730 : : "Nexthop device index does not match RTA_OIF");
731 : : goto errout;
732 : : }
733 : 0 : if (cfg->fc_gw_family) {
734 : 0 : if (cfg->fc_gw_family != nh->fib_nh_gw_family ||
735 : 0 : (cfg->fc_gw_family == AF_INET &&
736 : 0 : nh->fib_nh_gw4 != cfg->fc_gw4) ||
737 : 0 : (cfg->fc_gw_family == AF_INET6 &&
738 : 0 : ipv6_addr_cmp(&nh->fib_nh_gw6, &cfg->fc_gw6))) {
739 : 0 : NL_SET_ERR_MSG(extack,
740 : : "Nexthop gateway does not match RTA_GATEWAY or RTA_VIA");
741 : : goto errout;
742 : : }
743 : : }
744 : : #ifdef CONFIG_IP_ROUTE_CLASSID
745 : 0 : if (cfg->fc_flow && nh->nh_tclassid != cfg->fc_flow) {
746 : 0 : NL_SET_ERR_MSG(extack,
747 : : "Nexthop class id does not match RTA_FLOW");
748 : : goto errout;
749 : : }
750 : : #endif
751 : : ret = 0;
752 : : errout:
753 : 0 : return ret;
754 : : }
755 : :
756 : : /* only called when fib_nh is integrated into fib_info */
757 : 3 : static void fib_rebalance(struct fib_info *fi)
758 : : {
759 : : int total;
760 : : int w;
761 : :
762 : 3 : if (fib_info_num_path(fi) < 2)
763 : 3 : return;
764 : :
765 : : total = 0;
766 : 0 : for_nexthops(fi) {
767 : 0 : if (nh->fib_nh_flags & RTNH_F_DEAD)
768 : 0 : continue;
769 : :
770 : 0 : if (ip_ignore_linkdown(nh->fib_nh_dev) &&
771 : 0 : nh->fib_nh_flags & RTNH_F_LINKDOWN)
772 : 0 : continue;
773 : :
774 : 0 : total += nh->fib_nh_weight;
775 : : } endfor_nexthops(fi);
776 : :
777 : : w = 0;
778 : 0 : change_nexthops(fi) {
779 : : int upper_bound;
780 : :
781 : 0 : if (nexthop_nh->fib_nh_flags & RTNH_F_DEAD) {
782 : : upper_bound = -1;
783 : 0 : } else if (ip_ignore_linkdown(nexthop_nh->fib_nh_dev) &&
784 : 0 : nexthop_nh->fib_nh_flags & RTNH_F_LINKDOWN) {
785 : : upper_bound = -1;
786 : : } else {
787 : 0 : w += nexthop_nh->fib_nh_weight;
788 : 0 : upper_bound = DIV_ROUND_CLOSEST_ULL((u64)w << 31,
789 : : total) - 1;
790 : : }
791 : :
792 : : atomic_set(&nexthop_nh->fib_nh_upper_bound, upper_bound);
793 : : } endfor_nexthops(fi);
794 : : }
795 : : #else /* CONFIG_IP_ROUTE_MULTIPATH */
796 : :
797 : : static int fib_get_nhs(struct fib_info *fi, struct rtnexthop *rtnh,
798 : : int remaining, struct fib_config *cfg,
799 : : struct netlink_ext_ack *extack)
800 : : {
801 : : NL_SET_ERR_MSG(extack, "Multipath support not enabled in kernel");
802 : :
803 : : return -EINVAL;
804 : : }
805 : :
806 : : #define fib_rebalance(fi) do { } while (0)
807 : :
808 : : #endif /* CONFIG_IP_ROUTE_MULTIPATH */
809 : :
810 : : static int fib_encap_match(u16 encap_type,
811 : : struct nlattr *encap,
812 : : const struct fib_nh *nh,
813 : : const struct fib_config *cfg,
814 : : struct netlink_ext_ack *extack)
815 : : {
816 : : struct lwtunnel_state *lwtstate;
817 : : int ret, result = 0;
818 : :
819 : : if (encap_type == LWTUNNEL_ENCAP_NONE)
820 : : return 0;
821 : :
822 : : ret = lwtunnel_build_state(encap_type, encap, AF_INET,
823 : : cfg, &lwtstate, extack);
824 : : if (!ret) {
825 : : result = lwtunnel_cmp_encap(lwtstate, nh->fib_nh_lws);
826 : : lwtstate_free(lwtstate);
827 : : }
828 : :
829 : : return result;
830 : : }
831 : :
832 : 1 : int fib_nh_match(struct fib_config *cfg, struct fib_info *fi,
833 : : struct netlink_ext_ack *extack)
834 : : {
835 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
836 : : struct rtnexthop *rtnh;
837 : : int remaining;
838 : : #endif
839 : :
840 : 1 : if (cfg->fc_priority && cfg->fc_priority != fi->fib_priority)
841 : : return 1;
842 : :
843 : 1 : if (cfg->fc_nh_id) {
844 : 0 : if (fi->nh && cfg->fc_nh_id == fi->nh->id)
845 : : return 0;
846 : 0 : return 1;
847 : : }
848 : :
849 : 1 : if (cfg->fc_oif || cfg->fc_gw_family) {
850 : : struct fib_nh *nh = fib_info_nh(fi, 0);
851 : :
852 : : if (cfg->fc_encap) {
853 : : if (fib_encap_match(cfg->fc_encap_type, cfg->fc_encap,
854 : : nh, cfg, extack))
855 : : return 1;
856 : : }
857 : : #ifdef CONFIG_IP_ROUTE_CLASSID
858 : 1 : if (cfg->fc_flow &&
859 : 0 : cfg->fc_flow != nh->nh_tclassid)
860 : : return 1;
861 : : #endif
862 : 1 : if ((cfg->fc_oif && cfg->fc_oif != nh->fib_nh_oif) ||
863 : 1 : (cfg->fc_gw_family &&
864 : 0 : cfg->fc_gw_family != nh->fib_nh_gw_family))
865 : : return 1;
866 : :
867 : 1 : if (cfg->fc_gw_family == AF_INET &&
868 : 0 : cfg->fc_gw4 != nh->fib_nh_gw4)
869 : : return 1;
870 : :
871 : 1 : if (cfg->fc_gw_family == AF_INET6 &&
872 : 0 : ipv6_addr_cmp(&cfg->fc_gw6, &nh->fib_nh_gw6))
873 : : return 1;
874 : :
875 : 1 : return 0;
876 : : }
877 : :
878 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
879 : 0 : if (!cfg->fc_mp)
880 : : return 0;
881 : :
882 : : rtnh = cfg->fc_mp;
883 : 0 : remaining = cfg->fc_mp_len;
884 : :
885 : 0 : for_nexthops(fi) {
886 : : int attrlen;
887 : :
888 : 0 : if (!rtnh_ok(rtnh, remaining))
889 : : return -EINVAL;
890 : :
891 : 0 : if (rtnh->rtnh_ifindex && rtnh->rtnh_ifindex != nh->fib_nh_oif)
892 : : return 1;
893 : :
894 : : attrlen = rtnh_attrlen(rtnh);
895 : 0 : if (attrlen > 0) {
896 : : struct nlattr *nla, *nlav, *attrs = rtnh_attrs(rtnh);
897 : :
898 : 0 : nla = nla_find(attrs, attrlen, RTA_GATEWAY);
899 : 0 : nlav = nla_find(attrs, attrlen, RTA_VIA);
900 : 0 : if (nla && nlav) {
901 : 0 : NL_SET_ERR_MSG(extack,
902 : : "Nexthop configuration can not contain both GATEWAY and VIA");
903 : : return -EINVAL;
904 : : }
905 : :
906 : 0 : if (nla) {
907 : 0 : if (nh->fib_nh_gw_family != AF_INET ||
908 : 0 : nla_get_in_addr(nla) != nh->fib_nh_gw4)
909 : : return 1;
910 : 0 : } else if (nlav) {
911 : : struct fib_config cfg2;
912 : : int err;
913 : :
914 : 0 : err = fib_gw_from_via(&cfg2, nlav, extack);
915 : 0 : if (err)
916 : 0 : return err;
917 : :
918 : 0 : switch (nh->fib_nh_gw_family) {
919 : : case AF_INET:
920 : 0 : if (cfg2.fc_gw_family != AF_INET ||
921 : 0 : cfg2.fc_gw4 != nh->fib_nh_gw4)
922 : : return 1;
923 : : break;
924 : : case AF_INET6:
925 : 0 : if (cfg2.fc_gw_family != AF_INET6 ||
926 : 0 : ipv6_addr_cmp(&cfg2.fc_gw6,
927 : : &nh->fib_nh_gw6))
928 : : return 1;
929 : : break;
930 : : }
931 : : }
932 : :
933 : : #ifdef CONFIG_IP_ROUTE_CLASSID
934 : 0 : nla = nla_find(attrs, attrlen, RTA_FLOW);
935 : 0 : if (nla && nla_get_u32(nla) != nh->nh_tclassid)
936 : : return 1;
937 : : #endif
938 : : }
939 : :
940 : : rtnh = rtnh_next(rtnh, &remaining);
941 : : } endfor_nexthops(fi);
942 : : #endif
943 : : return 0;
944 : : }
945 : :
946 : 1 : bool fib_metrics_match(struct fib_config *cfg, struct fib_info *fi)
947 : : {
948 : : struct nlattr *nla;
949 : : int remaining;
950 : :
951 : 1 : if (!cfg->fc_mx)
952 : : return true;
953 : :
954 : 0 : nla_for_each_attr(nla, cfg->fc_mx, cfg->fc_mx_len, remaining) {
955 : : int type = nla_type(nla);
956 : : u32 fi_val, val;
957 : :
958 : 0 : if (!type)
959 : 0 : continue;
960 : 0 : if (type > RTAX_MAX)
961 : : return false;
962 : :
963 : 0 : if (type == RTAX_CC_ALGO) {
964 : : char tmp[TCP_CA_NAME_MAX];
965 : 0 : bool ecn_ca = false;
966 : :
967 : 0 : nla_strlcpy(tmp, nla, sizeof(tmp));
968 : 0 : val = tcp_ca_get_key_by_name(fi->fib_net, tmp, &ecn_ca);
969 : : } else {
970 : 0 : if (nla_len(nla) != sizeof(u32))
971 : : return false;
972 : : val = nla_get_u32(nla);
973 : : }
974 : :
975 : 0 : fi_val = fi->fib_metrics->metrics[type - 1];
976 : 0 : if (type == RTAX_FEATURES)
977 : 0 : fi_val &= ~DST_FEATURE_ECN_CA;
978 : :
979 : 0 : if (fi_val != val)
980 : : return false;
981 : : }
982 : :
983 : : return true;
984 : : }
985 : :
986 : 0 : static int fib_check_nh_v6_gw(struct net *net, struct fib_nh *nh,
987 : : u32 table, struct netlink_ext_ack *extack)
988 : : {
989 : 0 : struct fib6_config cfg = {
990 : : .fc_table = table,
991 : 0 : .fc_flags = nh->fib_nh_flags | RTF_GATEWAY,
992 : 0 : .fc_ifindex = nh->fib_nh_oif,
993 : : .fc_gateway = nh->fib_nh_gw6,
994 : : };
995 : 0 : struct fib6_nh fib6_nh = {};
996 : : int err;
997 : :
998 : 0 : err = ipv6_stub->fib6_nh_init(net, &fib6_nh, &cfg, GFP_KERNEL, extack);
999 : 0 : if (!err) {
1000 : 0 : nh->fib_nh_dev = fib6_nh.fib_nh_dev;
1001 : 0 : dev_hold(nh->fib_nh_dev);
1002 : 0 : nh->fib_nh_oif = nh->fib_nh_dev->ifindex;
1003 : 0 : nh->fib_nh_scope = RT_SCOPE_LINK;
1004 : :
1005 : 0 : ipv6_stub->fib6_nh_release(&fib6_nh);
1006 : : }
1007 : :
1008 : 0 : return err;
1009 : : }
1010 : :
1011 : : /*
1012 : : * Picture
1013 : : * -------
1014 : : *
1015 : : * Semantics of nexthop is very messy by historical reasons.
1016 : : * We have to take into account, that:
1017 : : * a) gateway can be actually local interface address,
1018 : : * so that gatewayed route is direct.
1019 : : * b) gateway must be on-link address, possibly
1020 : : * described not by an ifaddr, but also by a direct route.
1021 : : * c) If both gateway and interface are specified, they should not
1022 : : * contradict.
1023 : : * d) If we use tunnel routes, gateway could be not on-link.
1024 : : *
1025 : : * Attempt to reconcile all of these (alas, self-contradictory) conditions
1026 : : * results in pretty ugly and hairy code with obscure logic.
1027 : : *
1028 : : * I chose to generalized it instead, so that the size
1029 : : * of code does not increase practically, but it becomes
1030 : : * much more general.
1031 : : * Every prefix is assigned a "scope" value: "host" is local address,
1032 : : * "link" is direct route,
1033 : : * [ ... "site" ... "interior" ... ]
1034 : : * and "universe" is true gateway route with global meaning.
1035 : : *
1036 : : * Every prefix refers to a set of "nexthop"s (gw, oif),
1037 : : * where gw must have narrower scope. This recursion stops
1038 : : * when gw has LOCAL scope or if "nexthop" is declared ONLINK,
1039 : : * which means that gw is forced to be on link.
1040 : : *
1041 : : * Code is still hairy, but now it is apparently logically
1042 : : * consistent and very flexible. F.e. as by-product it allows
1043 : : * to co-exists in peace independent exterior and interior
1044 : : * routing processes.
1045 : : *
1046 : : * Normally it looks as following.
1047 : : *
1048 : : * {universe prefix} -> (gw, oif) [scope link]
1049 : : * |
1050 : : * |-> {link prefix} -> (gw, oif) [scope local]
1051 : : * |
1052 : : * |-> {local prefix} (terminal node)
1053 : : */
1054 : 3 : static int fib_check_nh_v4_gw(struct net *net, struct fib_nh *nh, u32 table,
1055 : : u8 scope, struct netlink_ext_ack *extack)
1056 : : {
1057 : : struct net_device *dev;
1058 : : struct fib_result res;
1059 : : int err = 0;
1060 : :
1061 : 3 : if (nh->fib_nh_flags & RTNH_F_ONLINK) {
1062 : : unsigned int addr_type;
1063 : :
1064 : 0 : if (scope >= RT_SCOPE_LINK) {
1065 : 0 : NL_SET_ERR_MSG(extack, "Nexthop has invalid scope");
1066 : : return -EINVAL;
1067 : : }
1068 : 0 : dev = __dev_get_by_index(net, nh->fib_nh_oif);
1069 : 0 : if (!dev) {
1070 : 0 : NL_SET_ERR_MSG(extack, "Nexthop device required for onlink");
1071 : : return -ENODEV;
1072 : : }
1073 : 0 : if (!(dev->flags & IFF_UP)) {
1074 : 0 : NL_SET_ERR_MSG(extack, "Nexthop device is not up");
1075 : : return -ENETDOWN;
1076 : : }
1077 : 0 : addr_type = inet_addr_type_dev_table(net, dev, nh->fib_nh_gw4);
1078 : 0 : if (addr_type != RTN_UNICAST) {
1079 : 0 : NL_SET_ERR_MSG(extack, "Nexthop has invalid gateway");
1080 : : return -EINVAL;
1081 : : }
1082 : 0 : if (!netif_carrier_ok(dev))
1083 : 0 : nh->fib_nh_flags |= RTNH_F_LINKDOWN;
1084 : 0 : nh->fib_nh_dev = dev;
1085 : 0 : dev_hold(dev);
1086 : 0 : nh->fib_nh_scope = RT_SCOPE_LINK;
1087 : 0 : return 0;
1088 : : }
1089 : : rcu_read_lock();
1090 : : {
1091 : : struct fib_table *tbl = NULL;
1092 : 3 : struct flowi4 fl4 = {
1093 : 3 : .daddr = nh->fib_nh_gw4,
1094 : : .flowi4_scope = scope + 1,
1095 : 3 : .flowi4_oif = nh->fib_nh_oif,
1096 : : .flowi4_iif = LOOPBACK_IFINDEX,
1097 : : };
1098 : :
1099 : : /* It is not necessary, but requires a bit of thinking */
1100 : 3 : if (fl4.flowi4_scope < RT_SCOPE_LINK)
1101 : 3 : fl4.flowi4_scope = RT_SCOPE_LINK;
1102 : :
1103 : 3 : if (table && table != RT_TABLE_MAIN)
1104 : 0 : tbl = fib_get_table(net, table);
1105 : :
1106 : 3 : if (tbl)
1107 : 0 : err = fib_table_lookup(tbl, &fl4, &res,
1108 : : FIB_LOOKUP_IGNORE_LINKSTATE |
1109 : : FIB_LOOKUP_NOREF);
1110 : :
1111 : : /* on error or if no table given do full lookup. This
1112 : : * is needed for example when nexthops are in the local
1113 : : * table rather than the given table
1114 : : */
1115 : 3 : if (!tbl || err) {
1116 : 3 : err = fib_lookup(net, &fl4, &res,
1117 : : FIB_LOOKUP_IGNORE_LINKSTATE);
1118 : : }
1119 : :
1120 : 3 : if (err) {
1121 : 0 : NL_SET_ERR_MSG(extack, "Nexthop has invalid gateway");
1122 : 0 : goto out;
1123 : : }
1124 : : }
1125 : :
1126 : : err = -EINVAL;
1127 : 3 : if (res.type != RTN_UNICAST && res.type != RTN_LOCAL) {
1128 : 0 : NL_SET_ERR_MSG(extack, "Nexthop has invalid gateway");
1129 : : goto out;
1130 : : }
1131 : 3 : nh->fib_nh_scope = res.scope;
1132 : 3 : nh->fib_nh_oif = FIB_RES_OIF(res);
1133 : 3 : nh->fib_nh_dev = dev = FIB_RES_DEV(res);
1134 : 3 : if (!dev) {
1135 : 0 : NL_SET_ERR_MSG(extack,
1136 : : "No egress device for nexthop gateway");
1137 : : goto out;
1138 : : }
1139 : 3 : dev_hold(dev);
1140 : 3 : if (!netif_carrier_ok(dev))
1141 : 0 : nh->fib_nh_flags |= RTNH_F_LINKDOWN;
1142 : 3 : err = (dev->flags & IFF_UP) ? 0 : -ENETDOWN;
1143 : : out:
1144 : : rcu_read_unlock();
1145 : 3 : return err;
1146 : : }
1147 : :
1148 : 3 : static int fib_check_nh_nongw(struct net *net, struct fib_nh *nh,
1149 : : struct netlink_ext_ack *extack)
1150 : : {
1151 : : struct in_device *in_dev;
1152 : : int err;
1153 : :
1154 : 3 : if (nh->fib_nh_flags & (RTNH_F_PERVASIVE | RTNH_F_ONLINK)) {
1155 : 0 : NL_SET_ERR_MSG(extack,
1156 : : "Invalid flags for nexthop - PERVASIVE and ONLINK can not be set");
1157 : : return -EINVAL;
1158 : : }
1159 : :
1160 : : rcu_read_lock();
1161 : :
1162 : : err = -ENODEV;
1163 : 3 : in_dev = inetdev_by_index(net, nh->fib_nh_oif);
1164 : 3 : if (!in_dev)
1165 : : goto out;
1166 : : err = -ENETDOWN;
1167 : 3 : if (!(in_dev->dev->flags & IFF_UP)) {
1168 : 0 : NL_SET_ERR_MSG(extack, "Device for nexthop is not up");
1169 : : goto out;
1170 : : }
1171 : :
1172 : 3 : nh->fib_nh_dev = in_dev->dev;
1173 : 3 : dev_hold(nh->fib_nh_dev);
1174 : 3 : nh->fib_nh_scope = RT_SCOPE_HOST;
1175 : 3 : if (!netif_carrier_ok(nh->fib_nh_dev))
1176 : 0 : nh->fib_nh_flags |= RTNH_F_LINKDOWN;
1177 : : err = 0;
1178 : : out:
1179 : : rcu_read_unlock();
1180 : 3 : return err;
1181 : : }
1182 : :
1183 : 3 : int fib_check_nh(struct net *net, struct fib_nh *nh, u32 table, u8 scope,
1184 : : struct netlink_ext_ack *extack)
1185 : : {
1186 : : int err;
1187 : :
1188 : 3 : if (nh->fib_nh_gw_family == AF_INET)
1189 : 3 : err = fib_check_nh_v4_gw(net, nh, table, scope, extack);
1190 : 3 : else if (nh->fib_nh_gw_family == AF_INET6)
1191 : 0 : err = fib_check_nh_v6_gw(net, nh, table, extack);
1192 : : else
1193 : 3 : err = fib_check_nh_nongw(net, nh, extack);
1194 : :
1195 : 3 : return err;
1196 : : }
1197 : :
1198 : : static inline unsigned int fib_laddr_hashfn(__be32 val)
1199 : : {
1200 : 3 : unsigned int mask = (fib_info_hash_size - 1);
1201 : :
1202 : 3 : return ((__force u32)val ^
1203 : 3 : ((__force u32)val >> 7) ^
1204 : 3 : ((__force u32)val >> 14)) & mask;
1205 : : }
1206 : :
1207 : 3 : static struct hlist_head *fib_info_hash_alloc(int bytes)
1208 : : {
1209 : 3 : if (bytes <= PAGE_SIZE)
1210 : 3 : return kzalloc(bytes, GFP_KERNEL);
1211 : : else
1212 : 0 : return (struct hlist_head *)
1213 : 0 : __get_free_pages(GFP_KERNEL | __GFP_ZERO,
1214 : 0 : get_order(bytes));
1215 : : }
1216 : :
1217 : 3 : static void fib_info_hash_free(struct hlist_head *hash, int bytes)
1218 : : {
1219 : 3 : if (!hash)
1220 : 3 : return;
1221 : :
1222 : 0 : if (bytes <= PAGE_SIZE)
1223 : 0 : kfree(hash);
1224 : : else
1225 : 0 : free_pages((unsigned long) hash, get_order(bytes));
1226 : : }
1227 : :
1228 : 3 : static void fib_info_hash_move(struct hlist_head *new_info_hash,
1229 : : struct hlist_head *new_laddrhash,
1230 : : unsigned int new_size)
1231 : : {
1232 : : struct hlist_head *old_info_hash, *old_laddrhash;
1233 : 3 : unsigned int old_size = fib_info_hash_size;
1234 : : unsigned int i, bytes;
1235 : :
1236 : : spin_lock_bh(&fib_info_lock);
1237 : 3 : old_info_hash = fib_info_hash;
1238 : 3 : old_laddrhash = fib_info_laddrhash;
1239 : 3 : fib_info_hash_size = new_size;
1240 : :
1241 : 3 : for (i = 0; i < old_size; i++) {
1242 : 0 : struct hlist_head *head = &fib_info_hash[i];
1243 : : struct hlist_node *n;
1244 : : struct fib_info *fi;
1245 : :
1246 : 0 : hlist_for_each_entry_safe(fi, n, head, fib_hash) {
1247 : : struct hlist_head *dest;
1248 : : unsigned int new_hash;
1249 : :
1250 : 0 : new_hash = fib_info_hashfn(fi);
1251 : 0 : dest = &new_info_hash[new_hash];
1252 : 0 : hlist_add_head(&fi->fib_hash, dest);
1253 : : }
1254 : : }
1255 : 3 : fib_info_hash = new_info_hash;
1256 : :
1257 : 3 : for (i = 0; i < old_size; i++) {
1258 : 0 : struct hlist_head *lhead = &fib_info_laddrhash[i];
1259 : : struct hlist_node *n;
1260 : : struct fib_info *fi;
1261 : :
1262 : 0 : hlist_for_each_entry_safe(fi, n, lhead, fib_lhash) {
1263 : : struct hlist_head *ldest;
1264 : : unsigned int new_hash;
1265 : :
1266 : 0 : new_hash = fib_laddr_hashfn(fi->fib_prefsrc);
1267 : 0 : ldest = &new_laddrhash[new_hash];
1268 : 0 : hlist_add_head(&fi->fib_lhash, ldest);
1269 : : }
1270 : : }
1271 : 3 : fib_info_laddrhash = new_laddrhash;
1272 : :
1273 : : spin_unlock_bh(&fib_info_lock);
1274 : :
1275 : 3 : bytes = old_size * sizeof(struct hlist_head *);
1276 : 3 : fib_info_hash_free(old_info_hash, bytes);
1277 : 3 : fib_info_hash_free(old_laddrhash, bytes);
1278 : 3 : }
1279 : :
1280 : 3 : __be32 fib_info_update_nhc_saddr(struct net *net, struct fib_nh_common *nhc,
1281 : : unsigned char scope)
1282 : : {
1283 : : struct fib_nh *nh;
1284 : :
1285 : 3 : if (nhc->nhc_family != AF_INET)
1286 : 0 : return inet_select_addr(nhc->nhc_dev, 0, scope);
1287 : :
1288 : : nh = container_of(nhc, struct fib_nh, nh_common);
1289 : 3 : nh->nh_saddr = inet_select_addr(nh->fib_nh_dev, nh->fib_nh_gw4, scope);
1290 : 3 : nh->nh_saddr_genid = atomic_read(&net->ipv4.dev_addr_genid);
1291 : :
1292 : 3 : return nh->nh_saddr;
1293 : : }
1294 : :
1295 : 3 : __be32 fib_result_prefsrc(struct net *net, struct fib_result *res)
1296 : : {
1297 : 3 : struct fib_nh_common *nhc = res->nhc;
1298 : :
1299 : 3 : if (res->fi->fib_prefsrc)
1300 : : return res->fi->fib_prefsrc;
1301 : :
1302 : 0 : if (nhc->nhc_family == AF_INET) {
1303 : : struct fib_nh *nh;
1304 : :
1305 : : nh = container_of(nhc, struct fib_nh, nh_common);
1306 : 0 : if (nh->nh_saddr_genid == atomic_read(&net->ipv4.dev_addr_genid))
1307 : 0 : return nh->nh_saddr;
1308 : : }
1309 : :
1310 : 0 : return fib_info_update_nhc_saddr(net, nhc, res->fi->fib_scope);
1311 : : }
1312 : :
1313 : 3 : static bool fib_valid_prefsrc(struct fib_config *cfg, __be32 fib_prefsrc)
1314 : : {
1315 : 3 : if (cfg->fc_type != RTN_LOCAL || !cfg->fc_dst ||
1316 : : fib_prefsrc != cfg->fc_dst) {
1317 : 3 : u32 tb_id = cfg->fc_table;
1318 : : int rc;
1319 : :
1320 : 3 : if (tb_id == RT_TABLE_MAIN)
1321 : : tb_id = RT_TABLE_LOCAL;
1322 : :
1323 : 3 : rc = inet_addr_type_table(cfg->fc_nlinfo.nl_net,
1324 : : fib_prefsrc, tb_id);
1325 : :
1326 : 3 : if (rc != RTN_LOCAL && tb_id != RT_TABLE_LOCAL) {
1327 : 0 : rc = inet_addr_type_table(cfg->fc_nlinfo.nl_net,
1328 : : fib_prefsrc, RT_TABLE_LOCAL);
1329 : : }
1330 : :
1331 : 3 : if (rc != RTN_LOCAL)
1332 : : return false;
1333 : : }
1334 : : return true;
1335 : : }
1336 : :
1337 : 3 : struct fib_info *fib_create_info(struct fib_config *cfg,
1338 : : struct netlink_ext_ack *extack)
1339 : : {
1340 : : int err;
1341 : : struct fib_info *fi = NULL;
1342 : : struct nexthop *nh = NULL;
1343 : : struct fib_info *ofi;
1344 : : int nhs = 1;
1345 : 3 : struct net *net = cfg->fc_nlinfo.nl_net;
1346 : :
1347 : 3 : if (cfg->fc_type > RTN_MAX)
1348 : : goto err_inval;
1349 : :
1350 : : /* Fast check to catch the most weird cases */
1351 : 3 : if (fib_props[cfg->fc_type].scope > cfg->fc_scope) {
1352 : 0 : NL_SET_ERR_MSG(extack, "Invalid scope");
1353 : : goto err_inval;
1354 : : }
1355 : :
1356 : 3 : if (cfg->fc_flags & (RTNH_F_DEAD | RTNH_F_LINKDOWN)) {
1357 : 0 : NL_SET_ERR_MSG(extack,
1358 : : "Invalid rtm_flags - can not contain DEAD or LINKDOWN");
1359 : : goto err_inval;
1360 : : }
1361 : :
1362 : 3 : if (cfg->fc_nh_id) {
1363 : 0 : if (!cfg->fc_mx) {
1364 : 0 : fi = fib_find_info_nh(net, cfg);
1365 : 0 : if (fi) {
1366 : 0 : fi->fib_treeref++;
1367 : 0 : return fi;
1368 : : }
1369 : : }
1370 : :
1371 : 0 : nh = nexthop_find_by_id(net, cfg->fc_nh_id);
1372 : 0 : if (!nh) {
1373 : 0 : NL_SET_ERR_MSG(extack, "Nexthop id does not exist");
1374 : : goto err_inval;
1375 : : }
1376 : : nhs = 0;
1377 : : }
1378 : :
1379 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
1380 : 3 : if (cfg->fc_mp) {
1381 : 0 : nhs = fib_count_nexthops(cfg->fc_mp, cfg->fc_mp_len, extack);
1382 : 0 : if (nhs == 0)
1383 : : goto err_inval;
1384 : : }
1385 : : #endif
1386 : :
1387 : : err = -ENOBUFS;
1388 : 3 : if (fib_info_cnt >= fib_info_hash_size) {
1389 : 3 : unsigned int new_size = fib_info_hash_size << 1;
1390 : : struct hlist_head *new_info_hash;
1391 : : struct hlist_head *new_laddrhash;
1392 : : unsigned int bytes;
1393 : :
1394 : 3 : if (!new_size)
1395 : : new_size = 16;
1396 : 3 : bytes = new_size * sizeof(struct hlist_head *);
1397 : 3 : new_info_hash = fib_info_hash_alloc(bytes);
1398 : 3 : new_laddrhash = fib_info_hash_alloc(bytes);
1399 : 3 : if (!new_info_hash || !new_laddrhash) {
1400 : 0 : fib_info_hash_free(new_info_hash, bytes);
1401 : 0 : fib_info_hash_free(new_laddrhash, bytes);
1402 : : } else
1403 : 3 : fib_info_hash_move(new_info_hash, new_laddrhash, new_size);
1404 : :
1405 : 3 : if (!fib_info_hash_size)
1406 : : goto failure;
1407 : : }
1408 : :
1409 : 3 : fi = kzalloc(struct_size(fi, fib_nh, nhs), GFP_KERNEL);
1410 : 3 : if (!fi)
1411 : : goto failure;
1412 : 3 : fi->fib_metrics = ip_fib_metrics_init(fi->fib_net, cfg->fc_mx,
1413 : : cfg->fc_mx_len, extack);
1414 : 3 : if (IS_ERR(fi->fib_metrics)) {
1415 : : err = PTR_ERR(fi->fib_metrics);
1416 : 0 : kfree(fi);
1417 : 0 : return ERR_PTR(err);
1418 : : }
1419 : :
1420 : 3 : fib_info_cnt++;
1421 : 3 : fi->fib_net = net;
1422 : 3 : fi->fib_protocol = cfg->fc_protocol;
1423 : 3 : fi->fib_scope = cfg->fc_scope;
1424 : 3 : fi->fib_flags = cfg->fc_flags;
1425 : 3 : fi->fib_priority = cfg->fc_priority;
1426 : 3 : fi->fib_prefsrc = cfg->fc_prefsrc;
1427 : 3 : fi->fib_type = cfg->fc_type;
1428 : 3 : fi->fib_tb_id = cfg->fc_table;
1429 : :
1430 : 3 : fi->fib_nhs = nhs;
1431 : 3 : if (nh) {
1432 : 0 : if (!nexthop_get(nh)) {
1433 : 0 : NL_SET_ERR_MSG(extack, "Nexthop has been deleted");
1434 : : err = -EINVAL;
1435 : : } else {
1436 : : err = 0;
1437 : 0 : fi->nh = nh;
1438 : : }
1439 : : } else {
1440 : 3 : change_nexthops(fi) {
1441 : 3 : nexthop_nh->nh_parent = fi;
1442 : : } endfor_nexthops(fi)
1443 : :
1444 : 3 : if (cfg->fc_mp)
1445 : 0 : err = fib_get_nhs(fi, cfg->fc_mp, cfg->fc_mp_len, cfg,
1446 : : extack);
1447 : : else
1448 : 3 : err = fib_nh_init(net, fi->fib_nh, cfg, 1, extack);
1449 : : }
1450 : :
1451 : 3 : if (err != 0)
1452 : : goto failure;
1453 : :
1454 : 3 : if (fib_props[cfg->fc_type].error) {
1455 : 0 : if (cfg->fc_gw_family || cfg->fc_oif || cfg->fc_mp) {
1456 : 0 : NL_SET_ERR_MSG(extack,
1457 : : "Gateway, device and multipath can not be specified for this route type");
1458 : : goto err_inval;
1459 : : }
1460 : : goto link_it;
1461 : : } else {
1462 : 3 : switch (cfg->fc_type) {
1463 : : case RTN_UNICAST:
1464 : : case RTN_LOCAL:
1465 : : case RTN_BROADCAST:
1466 : : case RTN_ANYCAST:
1467 : : case RTN_MULTICAST:
1468 : : break;
1469 : : default:
1470 : 0 : NL_SET_ERR_MSG(extack, "Invalid route type");
1471 : : goto err_inval;
1472 : : }
1473 : : }
1474 : :
1475 : 3 : if (cfg->fc_scope > RT_SCOPE_HOST) {
1476 : 0 : NL_SET_ERR_MSG(extack, "Invalid scope");
1477 : : goto err_inval;
1478 : : }
1479 : :
1480 : 3 : if (fi->nh) {
1481 : 0 : err = fib_check_nexthop(fi->nh, cfg->fc_scope, extack);
1482 : 0 : if (err)
1483 : : goto failure;
1484 : 3 : } else if (cfg->fc_scope == RT_SCOPE_HOST) {
1485 : : struct fib_nh *nh = fi->fib_nh;
1486 : :
1487 : : /* Local address is added. */
1488 : 3 : if (nhs != 1) {
1489 : 0 : NL_SET_ERR_MSG(extack,
1490 : : "Route with host scope can not have multiple nexthops");
1491 : : goto err_inval;
1492 : : }
1493 : 3 : if (nh->fib_nh_gw_family) {
1494 : 0 : NL_SET_ERR_MSG(extack,
1495 : : "Route with host scope can not have a gateway");
1496 : : goto err_inval;
1497 : : }
1498 : 3 : nh->fib_nh_scope = RT_SCOPE_NOWHERE;
1499 : 3 : nh->fib_nh_dev = dev_get_by_index(net, nh->fib_nh_oif);
1500 : : err = -ENODEV;
1501 : 3 : if (!nh->fib_nh_dev)
1502 : : goto failure;
1503 : : } else {
1504 : : int linkdown = 0;
1505 : :
1506 : 3 : change_nexthops(fi) {
1507 : 3 : err = fib_check_nh(cfg->fc_nlinfo.nl_net, nexthop_nh,
1508 : : cfg->fc_table, cfg->fc_scope,
1509 : : extack);
1510 : 3 : if (err != 0)
1511 : : goto failure;
1512 : 3 : if (nexthop_nh->fib_nh_flags & RTNH_F_LINKDOWN)
1513 : 0 : linkdown++;
1514 : : } endfor_nexthops(fi)
1515 : 3 : if (linkdown == fi->fib_nhs)
1516 : 0 : fi->fib_flags |= RTNH_F_LINKDOWN;
1517 : : }
1518 : :
1519 : 3 : if (fi->fib_prefsrc && !fib_valid_prefsrc(cfg, fi->fib_prefsrc)) {
1520 : 0 : NL_SET_ERR_MSG(extack, "Invalid prefsrc address");
1521 : : goto err_inval;
1522 : : }
1523 : :
1524 : 3 : if (!fi->nh) {
1525 : 3 : change_nexthops(fi) {
1526 : 3 : fib_info_update_nhc_saddr(net, &nexthop_nh->nh_common,
1527 : : fi->fib_scope);
1528 : 3 : if (nexthop_nh->fib_nh_gw_family == AF_INET6)
1529 : 0 : fi->fib_nh_is_v6 = true;
1530 : : } endfor_nexthops(fi)
1531 : :
1532 : 3 : fib_rebalance(fi);
1533 : : }
1534 : :
1535 : : link_it:
1536 : 3 : ofi = fib_find_info(fi);
1537 : 3 : if (ofi) {
1538 : 3 : fi->fib_dead = 1;
1539 : 3 : free_fib_info(fi);
1540 : 3 : ofi->fib_treeref++;
1541 : 3 : return ofi;
1542 : : }
1543 : :
1544 : 3 : fi->fib_treeref++;
1545 : : refcount_set(&fi->fib_clntref, 1);
1546 : : spin_lock_bh(&fib_info_lock);
1547 : 3 : hlist_add_head(&fi->fib_hash,
1548 : 3 : &fib_info_hash[fib_info_hashfn(fi)]);
1549 : 3 : if (fi->fib_prefsrc) {
1550 : : struct hlist_head *head;
1551 : :
1552 : 3 : head = &fib_info_laddrhash[fib_laddr_hashfn(fi->fib_prefsrc)];
1553 : 3 : hlist_add_head(&fi->fib_lhash, head);
1554 : : }
1555 : 3 : if (fi->nh) {
1556 : 0 : list_add(&fi->nh_list, &nh->fi_list);
1557 : : } else {
1558 : 3 : change_nexthops(fi) {
1559 : : struct hlist_head *head;
1560 : : unsigned int hash;
1561 : :
1562 : 3 : if (!nexthop_nh->fib_nh_dev)
1563 : 0 : continue;
1564 : 3 : hash = fib_devindex_hashfn(nexthop_nh->fib_nh_dev->ifindex);
1565 : 3 : head = &fib_info_devhash[hash];
1566 : 3 : hlist_add_head(&nexthop_nh->nh_hash, head);
1567 : : } endfor_nexthops(fi)
1568 : : }
1569 : : spin_unlock_bh(&fib_info_lock);
1570 : 3 : return fi;
1571 : :
1572 : : err_inval:
1573 : : err = -EINVAL;
1574 : :
1575 : : failure:
1576 : 0 : if (fi) {
1577 : 0 : fi->fib_dead = 1;
1578 : 0 : free_fib_info(fi);
1579 : : }
1580 : :
1581 : 0 : return ERR_PTR(err);
1582 : : }
1583 : :
1584 : 3 : int fib_nexthop_info(struct sk_buff *skb, const struct fib_nh_common *nhc,
1585 : : u8 rt_family, unsigned char *flags, bool skip_oif)
1586 : : {
1587 : 3 : if (nhc->nhc_flags & RTNH_F_DEAD)
1588 : 0 : *flags |= RTNH_F_DEAD;
1589 : :
1590 : 3 : if (nhc->nhc_flags & RTNH_F_LINKDOWN) {
1591 : 2 : *flags |= RTNH_F_LINKDOWN;
1592 : :
1593 : : rcu_read_lock();
1594 : 2 : switch (nhc->nhc_family) {
1595 : : case AF_INET:
1596 : 0 : if (ip_ignore_linkdown(nhc->nhc_dev))
1597 : 0 : *flags |= RTNH_F_DEAD;
1598 : : break;
1599 : : case AF_INET6:
1600 : 2 : if (ip6_ignore_linkdown(nhc->nhc_dev))
1601 : 0 : *flags |= RTNH_F_DEAD;
1602 : : break;
1603 : : }
1604 : : rcu_read_unlock();
1605 : : }
1606 : :
1607 : 3 : switch (nhc->nhc_gw_family) {
1608 : : case AF_INET:
1609 : 3 : if (nla_put_in_addr(skb, RTA_GATEWAY, nhc->nhc_gw.ipv4))
1610 : : goto nla_put_failure;
1611 : : break;
1612 : : case AF_INET6:
1613 : : /* if gateway family does not match nexthop family
1614 : : * gateway is encoded as RTA_VIA
1615 : : */
1616 : 1 : if (rt_family != nhc->nhc_gw_family) {
1617 : : int alen = sizeof(struct in6_addr);
1618 : : struct nlattr *nla;
1619 : : struct rtvia *via;
1620 : :
1621 : 0 : nla = nla_reserve(skb, RTA_VIA, alen + 2);
1622 : 0 : if (!nla)
1623 : : goto nla_put_failure;
1624 : :
1625 : : via = nla_data(nla);
1626 : 0 : via->rtvia_family = AF_INET6;
1627 : 0 : memcpy(via->rtvia_addr, &nhc->nhc_gw.ipv6, alen);
1628 : 1 : } else if (nla_put_in6_addr(skb, RTA_GATEWAY,
1629 : : &nhc->nhc_gw.ipv6) < 0) {
1630 : : goto nla_put_failure;
1631 : : }
1632 : : break;
1633 : : }
1634 : :
1635 : 3 : *flags |= (nhc->nhc_flags & RTNH_F_ONLINK);
1636 : 3 : if (nhc->nhc_flags & RTNH_F_OFFLOAD)
1637 : 0 : *flags |= RTNH_F_OFFLOAD;
1638 : :
1639 : 3 : if (!skip_oif && nhc->nhc_dev &&
1640 : 3 : nla_put_u32(skb, RTA_OIF, nhc->nhc_dev->ifindex))
1641 : : goto nla_put_failure;
1642 : :
1643 : : if (nhc->nhc_lwtstate &&
1644 : : lwtunnel_fill_encap(skb, nhc->nhc_lwtstate,
1645 : : RTA_ENCAP, RTA_ENCAP_TYPE) < 0)
1646 : : goto nla_put_failure;
1647 : :
1648 : : return 0;
1649 : :
1650 : : nla_put_failure:
1651 : : return -EMSGSIZE;
1652 : : }
1653 : : EXPORT_SYMBOL_GPL(fib_nexthop_info);
1654 : :
1655 : : #if IS_ENABLED(CONFIG_IP_ROUTE_MULTIPATH) || IS_ENABLED(CONFIG_IPV6)
1656 : 0 : int fib_add_nexthop(struct sk_buff *skb, const struct fib_nh_common *nhc,
1657 : : int nh_weight, u8 rt_family)
1658 : : {
1659 : 0 : const struct net_device *dev = nhc->nhc_dev;
1660 : : struct rtnexthop *rtnh;
1661 : 0 : unsigned char flags = 0;
1662 : :
1663 : 0 : rtnh = nla_reserve_nohdr(skb, sizeof(*rtnh));
1664 : 0 : if (!rtnh)
1665 : : goto nla_put_failure;
1666 : :
1667 : 0 : rtnh->rtnh_hops = nh_weight - 1;
1668 : 0 : rtnh->rtnh_ifindex = dev ? dev->ifindex : 0;
1669 : :
1670 : 0 : if (fib_nexthop_info(skb, nhc, rt_family, &flags, true) < 0)
1671 : : goto nla_put_failure;
1672 : :
1673 : 0 : rtnh->rtnh_flags = flags;
1674 : :
1675 : : /* length of rtnetlink header + attributes */
1676 : 0 : rtnh->rtnh_len = nlmsg_get_pos(skb) - (void *)rtnh;
1677 : :
1678 : 0 : return 0;
1679 : :
1680 : : nla_put_failure:
1681 : : return -EMSGSIZE;
1682 : : }
1683 : : EXPORT_SYMBOL_GPL(fib_add_nexthop);
1684 : : #endif
1685 : :
1686 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
1687 : 0 : static int fib_add_multipath(struct sk_buff *skb, struct fib_info *fi)
1688 : : {
1689 : : struct nlattr *mp;
1690 : :
1691 : : mp = nla_nest_start_noflag(skb, RTA_MULTIPATH);
1692 : 0 : if (!mp)
1693 : : goto nla_put_failure;
1694 : :
1695 : 0 : if (unlikely(fi->nh)) {
1696 : 0 : if (nexthop_mpath_fill_node(skb, fi->nh, AF_INET) < 0)
1697 : : goto nla_put_failure;
1698 : : goto mp_end;
1699 : : }
1700 : :
1701 : 0 : for_nexthops(fi) {
1702 : 0 : if (fib_add_nexthop(skb, &nh->nh_common, nh->fib_nh_weight,
1703 : : AF_INET) < 0)
1704 : : goto nla_put_failure;
1705 : : #ifdef CONFIG_IP_ROUTE_CLASSID
1706 : 0 : if (nh->nh_tclassid &&
1707 : : nla_put_u32(skb, RTA_FLOW, nh->nh_tclassid))
1708 : : goto nla_put_failure;
1709 : : #endif
1710 : : } endfor_nexthops(fi);
1711 : :
1712 : : mp_end:
1713 : : nla_nest_end(skb, mp);
1714 : :
1715 : 0 : return 0;
1716 : :
1717 : : nla_put_failure:
1718 : : return -EMSGSIZE;
1719 : : }
1720 : : #else
1721 : : static int fib_add_multipath(struct sk_buff *skb, struct fib_info *fi)
1722 : : {
1723 : : return 0;
1724 : : }
1725 : : #endif
1726 : :
1727 : 3 : int fib_dump_info(struct sk_buff *skb, u32 portid, u32 seq, int event,
1728 : : u32 tb_id, u8 type, __be32 dst, int dst_len, u8 tos,
1729 : : struct fib_info *fi, unsigned int flags)
1730 : : {
1731 : : unsigned int nhs = fib_info_num_path(fi);
1732 : : struct nlmsghdr *nlh;
1733 : : struct rtmsg *rtm;
1734 : :
1735 : 3 : nlh = nlmsg_put(skb, portid, seq, event, sizeof(*rtm), flags);
1736 : 3 : if (!nlh)
1737 : : return -EMSGSIZE;
1738 : :
1739 : : rtm = nlmsg_data(nlh);
1740 : 3 : rtm->rtm_family = AF_INET;
1741 : 3 : rtm->rtm_dst_len = dst_len;
1742 : 3 : rtm->rtm_src_len = 0;
1743 : 3 : rtm->rtm_tos = tos;
1744 : 3 : if (tb_id < 256)
1745 : 3 : rtm->rtm_table = tb_id;
1746 : : else
1747 : 0 : rtm->rtm_table = RT_TABLE_COMPAT;
1748 : 3 : if (nla_put_u32(skb, RTA_TABLE, tb_id))
1749 : : goto nla_put_failure;
1750 : 3 : rtm->rtm_type = type;
1751 : 3 : rtm->rtm_flags = fi->fib_flags;
1752 : 3 : rtm->rtm_scope = fi->fib_scope;
1753 : 3 : rtm->rtm_protocol = fi->fib_protocol;
1754 : :
1755 : 3 : if (rtm->rtm_dst_len &&
1756 : : nla_put_in_addr(skb, RTA_DST, dst))
1757 : : goto nla_put_failure;
1758 : 3 : if (fi->fib_priority &&
1759 : : nla_put_u32(skb, RTA_PRIORITY, fi->fib_priority))
1760 : : goto nla_put_failure;
1761 : 3 : if (rtnetlink_put_metrics(skb, fi->fib_metrics->metrics) < 0)
1762 : : goto nla_put_failure;
1763 : :
1764 : 3 : if (fi->fib_prefsrc &&
1765 : : nla_put_in_addr(skb, RTA_PREFSRC, fi->fib_prefsrc))
1766 : : goto nla_put_failure;
1767 : :
1768 : 3 : if (fi->nh) {
1769 : 0 : if (nla_put_u32(skb, RTA_NH_ID, fi->nh->id))
1770 : : goto nla_put_failure;
1771 : 0 : if (nexthop_is_blackhole(fi->nh))
1772 : 0 : rtm->rtm_type = RTN_BLACKHOLE;
1773 : : }
1774 : :
1775 : 3 : if (nhs == 1) {
1776 : 3 : const struct fib_nh_common *nhc = fib_info_nhc(fi, 0);
1777 : 3 : unsigned char flags = 0;
1778 : :
1779 : 3 : if (fib_nexthop_info(skb, nhc, AF_INET, &flags, false) < 0)
1780 : : goto nla_put_failure;
1781 : :
1782 : 3 : rtm->rtm_flags = flags;
1783 : : #ifdef CONFIG_IP_ROUTE_CLASSID
1784 : 3 : if (nhc->nhc_family == AF_INET) {
1785 : : struct fib_nh *nh;
1786 : :
1787 : : nh = container_of(nhc, struct fib_nh, nh_common);
1788 : 3 : if (nh->nh_tclassid &&
1789 : : nla_put_u32(skb, RTA_FLOW, nh->nh_tclassid))
1790 : : goto nla_put_failure;
1791 : : }
1792 : : #endif
1793 : : } else {
1794 : 0 : if (fib_add_multipath(skb, fi) < 0)
1795 : : goto nla_put_failure;
1796 : : }
1797 : :
1798 : : nlmsg_end(skb, nlh);
1799 : 3 : return 0;
1800 : :
1801 : : nla_put_failure:
1802 : : nlmsg_cancel(skb, nlh);
1803 : 0 : return -EMSGSIZE;
1804 : : }
1805 : :
1806 : : /*
1807 : : * Update FIB if:
1808 : : * - local address disappeared -> we must delete all the entries
1809 : : * referring to it.
1810 : : * - device went down -> we must shutdown all nexthops going via it.
1811 : : */
1812 : 1 : int fib_sync_down_addr(struct net_device *dev, __be32 local)
1813 : : {
1814 : : int ret = 0;
1815 : : unsigned int hash = fib_laddr_hashfn(local);
1816 : 1 : struct hlist_head *head = &fib_info_laddrhash[hash];
1817 : 1 : int tb_id = l3mdev_fib_table(dev) ? : RT_TABLE_MAIN;
1818 : : struct net *net = dev_net(dev);
1819 : : struct fib_info *fi;
1820 : :
1821 : 1 : if (!fib_info_laddrhash || local == 0)
1822 : : return 0;
1823 : :
1824 : 1 : hlist_for_each_entry(fi, head, fib_lhash) {
1825 : 1 : if (!net_eq(fi->fib_net, net) ||
1826 : 1 : fi->fib_tb_id != tb_id)
1827 : 1 : continue;
1828 : 1 : if (fi->fib_prefsrc == local) {
1829 : 1 : fi->fib_flags |= RTNH_F_DEAD;
1830 : 1 : ret++;
1831 : : }
1832 : : }
1833 : 1 : return ret;
1834 : : }
1835 : :
1836 : 0 : static int call_fib_nh_notifiers(struct fib_nh *nh,
1837 : : enum fib_event_type event_type)
1838 : : {
1839 : 0 : bool ignore_link_down = ip_ignore_linkdown(nh->fib_nh_dev);
1840 : 0 : struct fib_nh_notifier_info info = {
1841 : : .fib_nh = nh,
1842 : : };
1843 : :
1844 : 0 : switch (event_type) {
1845 : : case FIB_EVENT_NH_ADD:
1846 : 0 : if (nh->fib_nh_flags & RTNH_F_DEAD)
1847 : : break;
1848 : 0 : if (ignore_link_down && nh->fib_nh_flags & RTNH_F_LINKDOWN)
1849 : : break;
1850 : 0 : return call_fib4_notifiers(dev_net(nh->fib_nh_dev), event_type,
1851 : : &info.info);
1852 : : case FIB_EVENT_NH_DEL:
1853 : 0 : if ((ignore_link_down && nh->fib_nh_flags & RTNH_F_LINKDOWN) ||
1854 : 0 : (nh->fib_nh_flags & RTNH_F_DEAD))
1855 : 0 : return call_fib4_notifiers(dev_net(nh->fib_nh_dev),
1856 : : event_type, &info.info);
1857 : : default:
1858 : : break;
1859 : : }
1860 : :
1861 : : return NOTIFY_DONE;
1862 : : }
1863 : :
1864 : : /* Update the PMTU of exceptions when:
1865 : : * - the new MTU of the first hop becomes smaller than the PMTU
1866 : : * - the old MTU was the same as the PMTU, and it limited discovery of
1867 : : * larger MTUs on the path. With that limit raised, we can now
1868 : : * discover larger MTUs
1869 : : * A special case is locked exceptions, for which the PMTU is smaller
1870 : : * than the minimal accepted PMTU:
1871 : : * - if the new MTU is greater than the PMTU, don't make any change
1872 : : * - otherwise, unlock and set PMTU
1873 : : */
1874 : 0 : void fib_nhc_update_mtu(struct fib_nh_common *nhc, u32 new, u32 orig)
1875 : : {
1876 : : struct fnhe_hash_bucket *bucket;
1877 : : int i;
1878 : :
1879 : 0 : bucket = rcu_dereference_protected(nhc->nhc_exceptions, 1);
1880 : 0 : if (!bucket)
1881 : 0 : return;
1882 : :
1883 : 0 : for (i = 0; i < FNHE_HASH_SIZE; i++) {
1884 : : struct fib_nh_exception *fnhe;
1885 : :
1886 : 0 : for (fnhe = rcu_dereference_protected(bucket[i].chain, 1);
1887 : : fnhe;
1888 : 0 : fnhe = rcu_dereference_protected(fnhe->fnhe_next, 1)) {
1889 : 0 : if (fnhe->fnhe_mtu_locked) {
1890 : 0 : if (new <= fnhe->fnhe_pmtu) {
1891 : 0 : fnhe->fnhe_pmtu = new;
1892 : 0 : fnhe->fnhe_mtu_locked = false;
1893 : : }
1894 : 0 : } else if (new < fnhe->fnhe_pmtu ||
1895 : : orig == fnhe->fnhe_pmtu) {
1896 : 0 : fnhe->fnhe_pmtu = new;
1897 : : }
1898 : : }
1899 : : }
1900 : : }
1901 : :
1902 : 0 : void fib_sync_mtu(struct net_device *dev, u32 orig_mtu)
1903 : : {
1904 : 0 : unsigned int hash = fib_devindex_hashfn(dev->ifindex);
1905 : : struct hlist_head *head = &fib_info_devhash[hash];
1906 : : struct fib_nh *nh;
1907 : :
1908 : 0 : hlist_for_each_entry(nh, head, nh_hash) {
1909 : 0 : if (nh->fib_nh_dev == dev)
1910 : 0 : fib_nhc_update_mtu(&nh->nh_common, dev->mtu, orig_mtu);
1911 : : }
1912 : 0 : }
1913 : :
1914 : : /* Event force Flags Description
1915 : : * NETDEV_CHANGE 0 LINKDOWN Carrier OFF, not for scope host
1916 : : * NETDEV_DOWN 0 LINKDOWN|DEAD Link down, not for scope host
1917 : : * NETDEV_DOWN 1 LINKDOWN|DEAD Last address removed
1918 : : * NETDEV_UNREGISTER 1 LINKDOWN|DEAD Device removed
1919 : : *
1920 : : * only used when fib_nh is built into fib_info
1921 : : */
1922 : 3 : int fib_sync_down_dev(struct net_device *dev, unsigned long event, bool force)
1923 : : {
1924 : : int ret = 0;
1925 : : int scope = RT_SCOPE_NOWHERE;
1926 : : struct fib_info *prev_fi = NULL;
1927 : 3 : unsigned int hash = fib_devindex_hashfn(dev->ifindex);
1928 : : struct hlist_head *head = &fib_info_devhash[hash];
1929 : : struct fib_nh *nh;
1930 : :
1931 : 3 : if (force)
1932 : : scope = -1;
1933 : :
1934 : 3 : hlist_for_each_entry(nh, head, nh_hash) {
1935 : 1 : struct fib_info *fi = nh->nh_parent;
1936 : : int dead;
1937 : :
1938 : 1 : BUG_ON(!fi->fib_nhs);
1939 : 1 : if (nh->fib_nh_dev != dev || fi == prev_fi)
1940 : 1 : continue;
1941 : : prev_fi = fi;
1942 : : dead = 0;
1943 : 0 : change_nexthops(fi) {
1944 : 0 : if (nexthop_nh->fib_nh_flags & RTNH_F_DEAD)
1945 : 0 : dead++;
1946 : 0 : else if (nexthop_nh->fib_nh_dev == dev &&
1947 : 0 : nexthop_nh->fib_nh_scope != scope) {
1948 : 0 : switch (event) {
1949 : : case NETDEV_DOWN:
1950 : : case NETDEV_UNREGISTER:
1951 : 0 : nexthop_nh->fib_nh_flags |= RTNH_F_DEAD;
1952 : : /* fall through */
1953 : : case NETDEV_CHANGE:
1954 : 0 : nexthop_nh->fib_nh_flags |= RTNH_F_LINKDOWN;
1955 : 0 : break;
1956 : : }
1957 : 0 : call_fib_nh_notifiers(nexthop_nh,
1958 : : FIB_EVENT_NH_DEL);
1959 : 0 : dead++;
1960 : : }
1961 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
1962 : 0 : if (event == NETDEV_UNREGISTER &&
1963 : 0 : nexthop_nh->fib_nh_dev == dev) {
1964 : 0 : dead = fi->fib_nhs;
1965 : 0 : break;
1966 : : }
1967 : : #endif
1968 : : } endfor_nexthops(fi)
1969 : 0 : if (dead == fi->fib_nhs) {
1970 : 0 : switch (event) {
1971 : : case NETDEV_DOWN:
1972 : : case NETDEV_UNREGISTER:
1973 : 0 : fi->fib_flags |= RTNH_F_DEAD;
1974 : : /* fall through */
1975 : : case NETDEV_CHANGE:
1976 : 0 : fi->fib_flags |= RTNH_F_LINKDOWN;
1977 : 0 : break;
1978 : : }
1979 : 0 : ret++;
1980 : : }
1981 : :
1982 : 0 : fib_rebalance(fi);
1983 : : }
1984 : :
1985 : 3 : return ret;
1986 : : }
1987 : :
1988 : : /* Must be invoked inside of an RCU protected region. */
1989 : 0 : static void fib_select_default(const struct flowi4 *flp, struct fib_result *res)
1990 : : {
1991 : 0 : struct fib_info *fi = NULL, *last_resort = NULL;
1992 : 0 : struct hlist_head *fa_head = res->fa_head;
1993 : 0 : struct fib_table *tb = res->table;
1994 : 0 : u8 slen = 32 - res->prefixlen;
1995 : 0 : int order = -1, last_idx = -1;
1996 : : struct fib_alias *fa, *fa1 = NULL;
1997 : 0 : u32 last_prio = res->fi->fib_priority;
1998 : : u8 last_tos = 0;
1999 : :
2000 : 0 : hlist_for_each_entry_rcu(fa, fa_head, fa_list) {
2001 : 0 : struct fib_info *next_fi = fa->fa_info;
2002 : : struct fib_nh_common *nhc;
2003 : :
2004 : 0 : if (fa->fa_slen != slen)
2005 : 0 : continue;
2006 : 0 : if (fa->fa_tos && fa->fa_tos != flp->flowi4_tos)
2007 : 0 : continue;
2008 : 0 : if (fa->tb_id != tb->tb_id)
2009 : 0 : continue;
2010 : 0 : if (next_fi->fib_priority > last_prio &&
2011 : : fa->fa_tos == last_tos) {
2012 : 0 : if (last_tos)
2013 : 0 : continue;
2014 : : break;
2015 : : }
2016 : 0 : if (next_fi->fib_flags & RTNH_F_DEAD)
2017 : 0 : continue;
2018 : : last_tos = fa->fa_tos;
2019 : : last_prio = next_fi->fib_priority;
2020 : :
2021 : 0 : if (next_fi->fib_scope != res->scope ||
2022 : 0 : fa->fa_type != RTN_UNICAST)
2023 : 0 : continue;
2024 : :
2025 : 0 : nhc = fib_info_nhc(next_fi, 0);
2026 : 0 : if (!nhc->nhc_gw_family || nhc->nhc_scope != RT_SCOPE_LINK)
2027 : 0 : continue;
2028 : :
2029 : : fib_alias_accessed(fa);
2030 : :
2031 : 0 : if (!fi) {
2032 : 0 : if (next_fi != res->fi)
2033 : : break;
2034 : : fa1 = fa;
2035 : 0 : } else if (!fib_detect_death(fi, order, &last_resort,
2036 : 0 : &last_idx, fa1->fa_default)) {
2037 : : fib_result_assign(res, fi);
2038 : 0 : fa1->fa_default = order;
2039 : 0 : goto out;
2040 : : }
2041 : : fi = next_fi;
2042 : 0 : order++;
2043 : : }
2044 : :
2045 : 0 : if (order <= 0 || !fi) {
2046 : 0 : if (fa1)
2047 : 0 : fa1->fa_default = -1;
2048 : : goto out;
2049 : : }
2050 : :
2051 : 0 : if (!fib_detect_death(fi, order, &last_resort, &last_idx,
2052 : 0 : fa1->fa_default)) {
2053 : : fib_result_assign(res, fi);
2054 : 0 : fa1->fa_default = order;
2055 : 0 : goto out;
2056 : : }
2057 : :
2058 : 0 : if (last_idx >= 0)
2059 : 0 : fib_result_assign(res, last_resort);
2060 : 0 : fa1->fa_default = last_idx;
2061 : : out:
2062 : 0 : return;
2063 : : }
2064 : :
2065 : : /*
2066 : : * Dead device goes up. We wake up dead nexthops.
2067 : : * It takes sense only on multipath routes.
2068 : : *
2069 : : * only used when fib_nh is built into fib_info
2070 : : */
2071 : 3 : int fib_sync_up(struct net_device *dev, unsigned char nh_flags)
2072 : : {
2073 : : struct fib_info *prev_fi;
2074 : : unsigned int hash;
2075 : : struct hlist_head *head;
2076 : : struct fib_nh *nh;
2077 : : int ret;
2078 : :
2079 : 3 : if (!(dev->flags & IFF_UP))
2080 : : return 0;
2081 : :
2082 : 3 : if (nh_flags & RTNH_F_DEAD) {
2083 : 3 : unsigned int flags = dev_get_flags(dev);
2084 : :
2085 : 3 : if (flags & (IFF_RUNNING | IFF_LOWER_UP))
2086 : 3 : nh_flags |= RTNH_F_LINKDOWN;
2087 : : }
2088 : :
2089 : : prev_fi = NULL;
2090 : 3 : hash = fib_devindex_hashfn(dev->ifindex);
2091 : : head = &fib_info_devhash[hash];
2092 : : ret = 0;
2093 : :
2094 : 3 : hlist_for_each_entry(nh, head, nh_hash) {
2095 : 3 : struct fib_info *fi = nh->nh_parent;
2096 : : int alive;
2097 : :
2098 : 3 : BUG_ON(!fi->fib_nhs);
2099 : 3 : if (nh->fib_nh_dev != dev || fi == prev_fi)
2100 : 0 : continue;
2101 : :
2102 : : prev_fi = fi;
2103 : : alive = 0;
2104 : 3 : change_nexthops(fi) {
2105 : 3 : if (!(nexthop_nh->fib_nh_flags & nh_flags)) {
2106 : 3 : alive++;
2107 : 3 : continue;
2108 : : }
2109 : 0 : if (!nexthop_nh->fib_nh_dev ||
2110 : 0 : !(nexthop_nh->fib_nh_dev->flags & IFF_UP))
2111 : 0 : continue;
2112 : 0 : if (nexthop_nh->fib_nh_dev != dev ||
2113 : : !__in_dev_get_rtnl(dev))
2114 : 0 : continue;
2115 : 0 : alive++;
2116 : 0 : nexthop_nh->fib_nh_flags &= ~nh_flags;
2117 : 0 : call_fib_nh_notifiers(nexthop_nh, FIB_EVENT_NH_ADD);
2118 : : } endfor_nexthops(fi)
2119 : :
2120 : 3 : if (alive > 0) {
2121 : 3 : fi->fib_flags &= ~nh_flags;
2122 : 3 : ret++;
2123 : : }
2124 : :
2125 : 3 : fib_rebalance(fi);
2126 : : }
2127 : :
2128 : 3 : return ret;
2129 : : }
2130 : :
2131 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
2132 : 0 : static bool fib_good_nh(const struct fib_nh *nh)
2133 : : {
2134 : : int state = NUD_REACHABLE;
2135 : :
2136 : 0 : if (nh->fib_nh_scope == RT_SCOPE_LINK) {
2137 : : struct neighbour *n;
2138 : :
2139 : : rcu_read_lock_bh();
2140 : :
2141 : 0 : if (likely(nh->fib_nh_gw_family == AF_INET))
2142 : 0 : n = __ipv4_neigh_lookup_noref(nh->fib_nh_dev,
2143 : : (__force u32)nh->fib_nh_gw4);
2144 : 0 : else if (nh->fib_nh_gw_family == AF_INET6)
2145 : 0 : n = __ipv6_neigh_lookup_noref_stub(nh->fib_nh_dev,
2146 : 0 : &nh->fib_nh_gw6);
2147 : : else
2148 : : n = NULL;
2149 : 0 : if (n)
2150 : 0 : state = n->nud_state;
2151 : :
2152 : : rcu_read_unlock_bh();
2153 : : }
2154 : :
2155 : 0 : return !!(state & NUD_VALID);
2156 : : }
2157 : :
2158 : 0 : void fib_select_multipath(struct fib_result *res, int hash)
2159 : : {
2160 : 0 : struct fib_info *fi = res->fi;
2161 : 0 : struct net *net = fi->fib_net;
2162 : : bool first = false;
2163 : :
2164 : 0 : if (unlikely(res->fi->nh)) {
2165 : : nexthop_path_fib_result(res, hash);
2166 : : return;
2167 : : }
2168 : :
2169 : 0 : change_nexthops(fi) {
2170 : 0 : if (net->ipv4.sysctl_fib_multipath_use_neigh) {
2171 : 0 : if (!fib_good_nh(nexthop_nh))
2172 : 0 : continue;
2173 : 0 : if (!first) {
2174 : 0 : res->nh_sel = nhsel;
2175 : 0 : res->nhc = &nexthop_nh->nh_common;
2176 : : first = true;
2177 : : }
2178 : : }
2179 : :
2180 : 0 : if (hash > atomic_read(&nexthop_nh->fib_nh_upper_bound))
2181 : 0 : continue;
2182 : :
2183 : 0 : res->nh_sel = nhsel;
2184 : 0 : res->nhc = &nexthop_nh->nh_common;
2185 : 0 : return;
2186 : : } endfor_nexthops(fi);
2187 : : }
2188 : : #endif
2189 : :
2190 : 3 : void fib_select_path(struct net *net, struct fib_result *res,
2191 : : struct flowi4 *fl4, const struct sk_buff *skb)
2192 : : {
2193 : 3 : if (fl4->flowi4_oif && !(fl4->flowi4_flags & FLOWI_FLAG_SKIP_NH_OIF))
2194 : : goto check_saddr;
2195 : :
2196 : : #ifdef CONFIG_IP_ROUTE_MULTIPATH
2197 : 3 : if (fib_info_num_path(res->fi) > 1) {
2198 : 0 : int h = fib_multipath_hash(net, fl4, skb, NULL);
2199 : :
2200 : 0 : fib_select_multipath(res, h);
2201 : : }
2202 : : else
2203 : : #endif
2204 : 3 : if (!res->prefixlen &&
2205 : 3 : res->table->tb_num_default > 1 &&
2206 : 0 : res->type == RTN_UNICAST)
2207 : 0 : fib_select_default(fl4, res);
2208 : :
2209 : : check_saddr:
2210 : 3 : if (!fl4->saddr)
2211 : 3 : fl4->saddr = fib_result_prefsrc(net, res);
2212 : 3 : }
|