LCOV - code coverage report
Current view: top level - fs - pipe.c (source / functions) Hit Total Coverage
Test: combined.info Lines: 346 631 54.8 %
Date: 2022-04-01 13:59:58 Functions: 22 40 55.0 %
Branches: 128 453 28.3 %

           Branch data     Line data    Source code
       1                 :            : // SPDX-License-Identifier: GPL-2.0
       2                 :            : /*
       3                 :            :  *  linux/fs/pipe.c
       4                 :            :  *
       5                 :            :  *  Copyright (C) 1991, 1992, 1999  Linus Torvalds
       6                 :            :  */
       7                 :            : 
       8                 :            : #include <linux/mm.h>
       9                 :            : #include <linux/file.h>
      10                 :            : #include <linux/poll.h>
      11                 :            : #include <linux/slab.h>
      12                 :            : #include <linux/module.h>
      13                 :            : #include <linux/init.h>
      14                 :            : #include <linux/fs.h>
      15                 :            : #include <linux/log2.h>
      16                 :            : #include <linux/mount.h>
      17                 :            : #include <linux/pseudo_fs.h>
      18                 :            : #include <linux/magic.h>
      19                 :            : #include <linux/pipe_fs_i.h>
      20                 :            : #include <linux/uio.h>
      21                 :            : #include <linux/highmem.h>
      22                 :            : #include <linux/pagemap.h>
      23                 :            : #include <linux/audit.h>
      24                 :            : #include <linux/syscalls.h>
      25                 :            : #include <linux/fcntl.h>
      26                 :            : #include <linux/memcontrol.h>
      27                 :            : 
      28                 :            : #include <linux/uaccess.h>
      29                 :            : #include <asm/ioctls.h>
      30                 :            : 
      31                 :            : #include "internal.h"
      32                 :            : 
      33                 :            : /*
      34                 :            :  * The max size that a non-root user is allowed to grow the pipe. Can
      35                 :            :  * be set by root in /proc/sys/fs/pipe-max-size
      36                 :            :  */
      37                 :            : unsigned int pipe_max_size = 1048576;
      38                 :            : 
      39                 :            : /* Maximum allocatable pages per user. Hard limit is unset by default, soft
      40                 :            :  * matches default values.
      41                 :            :  */
      42                 :            : unsigned long pipe_user_pages_hard;
      43                 :            : unsigned long pipe_user_pages_soft = PIPE_DEF_BUFFERS * INR_OPEN_CUR;
      44                 :            : 
      45                 :            : /*
      46                 :            :  * We use head and tail indices that aren't masked off, except at the point of
      47                 :            :  * dereference, but rather they're allowed to wrap naturally.  This means there
      48                 :            :  * isn't a dead spot in the buffer, but the ring has to be a power of two and
      49                 :            :  * <= 2^31.
      50                 :            :  * -- David Howells 2019-09-23.
      51                 :            :  *
      52                 :            :  * Reads with count = 0 should always return 0.
      53                 :            :  * -- Julian Bradfield 1999-06-07.
      54                 :            :  *
      55                 :            :  * FIFOs and Pipes now generate SIGIO for both readers and writers.
      56                 :            :  * -- Jeremy Elson <jelson@circlemud.org> 2001-08-16
      57                 :            :  *
      58                 :            :  * pipe_read & write cleanup
      59                 :            :  * -- Manfred Spraul <manfred@colorfullife.com> 2002-05-09
      60                 :            :  */
      61                 :            : 
      62                 :        312 : static void pipe_lock_nested(struct pipe_inode_info *pipe, int subclass)
      63                 :            : {
      64                 :        312 :         if (pipe->files)
      65                 :          0 :                 mutex_lock_nested(&pipe->mutex, subclass);
      66                 :            : }
      67                 :            : 
      68                 :        312 : void pipe_lock(struct pipe_inode_info *pipe)
      69                 :            : {
      70                 :            :         /*
      71                 :            :          * pipe_lock() nests non-pipe inode locks (for writing to a file)
      72                 :            :          */
      73         [ -  + ]:        312 :         pipe_lock_nested(pipe, I_MUTEX_PARENT);
      74                 :        312 : }
      75                 :            : EXPORT_SYMBOL(pipe_lock);
      76                 :            : 
      77                 :        312 : void pipe_unlock(struct pipe_inode_info *pipe)
      78                 :            : {
      79         [ -  + ]:        312 :         if (pipe->files)
      80                 :          0 :                 mutex_unlock(&pipe->mutex);
      81                 :        312 : }
      82                 :            : EXPORT_SYMBOL(pipe_unlock);
      83                 :            : 
      84                 :     507843 : static inline void __pipe_lock(struct pipe_inode_info *pipe)
      85                 :            : {
      86                 :     507843 :         mutex_lock_nested(&pipe->mutex, I_MUTEX_PARENT);
      87                 :            : }
      88                 :            : 
      89                 :     507843 : static inline void __pipe_unlock(struct pipe_inode_info *pipe)
      90                 :            : {
      91                 :     507843 :         mutex_unlock(&pipe->mutex);
      92                 :            : }
      93                 :            : 
      94                 :          0 : void pipe_double_lock(struct pipe_inode_info *pipe1,
      95                 :            :                       struct pipe_inode_info *pipe2)
      96                 :            : {
      97         [ #  # ]:          0 :         BUG_ON(pipe1 == pipe2);
      98                 :            : 
      99         [ #  # ]:          0 :         if (pipe1 < pipe2) {
     100         [ #  # ]:          0 :                 pipe_lock_nested(pipe1, I_MUTEX_PARENT);
     101         [ #  # ]:          0 :                 pipe_lock_nested(pipe2, I_MUTEX_CHILD);
     102                 :            :         } else {
     103         [ #  # ]:          0 :                 pipe_lock_nested(pipe2, I_MUTEX_PARENT);
     104         [ #  # ]:          0 :                 pipe_lock_nested(pipe1, I_MUTEX_CHILD);
     105                 :            :         }
     106                 :          0 : }
     107                 :            : 
     108                 :            : /* Drop the inode semaphore and wait for a pipe event, atomically */
     109                 :          0 : void pipe_wait(struct pipe_inode_info *pipe)
     110                 :            : {
     111                 :          0 :         DEFINE_WAIT(rdwait);
     112                 :          0 :         DEFINE_WAIT(wrwait);
     113                 :            : 
     114                 :            :         /*
     115                 :            :          * Pipes are system-local resources, so sleeping on them
     116                 :            :          * is considered a noninteractive wait:
     117                 :            :          */
     118                 :          0 :         prepare_to_wait(&pipe->rd_wait, &rdwait, TASK_INTERRUPTIBLE);
     119                 :          0 :         prepare_to_wait(&pipe->wr_wait, &wrwait, TASK_INTERRUPTIBLE);
     120         [ #  # ]:          0 :         pipe_unlock(pipe);
     121                 :          0 :         schedule();
     122                 :          0 :         finish_wait(&pipe->rd_wait, &rdwait);
     123                 :          0 :         finish_wait(&pipe->wr_wait, &wrwait);
     124         [ #  # ]:          0 :         pipe_lock(pipe);
     125                 :          0 : }
     126                 :            : 
     127                 :        724 : static void anon_pipe_buf_release(struct pipe_inode_info *pipe,
     128                 :            :                                   struct pipe_buffer *buf)
     129                 :            : {
     130                 :        724 :         struct page *page = buf->page;
     131                 :            : 
     132                 :            :         /*
     133                 :            :          * If nobody else uses this page, and we don't already have a
     134                 :            :          * temporary page, let's keep track of it as a one-deep
     135                 :            :          * allocation cache. (Otherwise just release our reference to it)
     136                 :            :          */
     137   [ -  +  +  -  :       1448 :         if (page_count(page) == 1 && !pipe->tmp_page)
                   +  - ]
     138                 :        724 :                 pipe->tmp_page = page;
     139                 :            :         else
     140                 :          0 :                 put_page(page);
     141                 :        724 : }
     142                 :            : 
     143                 :          0 : static int anon_pipe_buf_steal(struct pipe_inode_info *pipe,
     144                 :            :                                struct pipe_buffer *buf)
     145                 :            : {
     146                 :          0 :         struct page *page = buf->page;
     147                 :            : 
     148   [ #  #  #  # ]:          0 :         if (page_count(page) == 1) {
     149         [ #  # ]:          0 :                 memcg_kmem_uncharge(page, 0);
     150         [ #  # ]:          0 :                 __SetPageLocked(page);
     151                 :          0 :                 return 0;
     152                 :            :         }
     153                 :            :         return 1;
     154                 :            : }
     155                 :            : 
     156                 :            : /**
     157                 :            :  * generic_pipe_buf_steal - attempt to take ownership of a &pipe_buffer
     158                 :            :  * @pipe:       the pipe that the buffer belongs to
     159                 :            :  * @buf:        the buffer to attempt to steal
     160                 :            :  *
     161                 :            :  * Description:
     162                 :            :  *      This function attempts to steal the &struct page attached to
     163                 :            :  *      @buf. If successful, this function returns 0 and returns with
     164                 :            :  *      the page locked. The caller may then reuse the page for whatever
     165                 :            :  *      he wishes; the typical use is insertion into a different file
     166                 :            :  *      page cache.
     167                 :            :  */
     168                 :          0 : int generic_pipe_buf_steal(struct pipe_inode_info *pipe,
     169                 :            :                            struct pipe_buffer *buf)
     170                 :            : {
     171                 :          0 :         struct page *page = buf->page;
     172                 :            : 
     173                 :            :         /*
     174                 :            :          * A reference of one is golden, that means that the owner of this
     175                 :            :          * page is the only one holding a reference to it. lock the page
     176                 :            :          * and return OK.
     177                 :            :          */
     178   [ #  #  #  # ]:          0 :         if (page_count(page) == 1) {
     179                 :          0 :                 lock_page(page);
     180                 :          0 :                 return 0;
     181                 :            :         }
     182                 :            : 
     183                 :            :         return 1;
     184                 :            : }
     185                 :            : EXPORT_SYMBOL(generic_pipe_buf_steal);
     186                 :            : 
     187                 :            : /**
     188                 :            :  * generic_pipe_buf_get - get a reference to a &struct pipe_buffer
     189                 :            :  * @pipe:       the pipe that the buffer belongs to
     190                 :            :  * @buf:        the buffer to get a reference to
     191                 :            :  *
     192                 :            :  * Description:
     193                 :            :  *      This function grabs an extra reference to @buf. It's used in
     194                 :            :  *      in the tee() system call, when we duplicate the buffers in one
     195                 :            :  *      pipe into another.
     196                 :            :  */
     197                 :          0 : bool generic_pipe_buf_get(struct pipe_inode_info *pipe, struct pipe_buffer *buf)
     198                 :            : {
     199                 :          0 :         return try_get_page(buf->page);
     200                 :            : }
     201                 :            : EXPORT_SYMBOL(generic_pipe_buf_get);
     202                 :            : 
     203                 :            : /**
     204                 :            :  * generic_pipe_buf_confirm - verify contents of the pipe buffer
     205                 :            :  * @info:       the pipe that the buffer belongs to
     206                 :            :  * @buf:        the buffer to confirm
     207                 :            :  *
     208                 :            :  * Description:
     209                 :            :  *      This function does nothing, because the generic pipe code uses
     210                 :            :  *      pages that are always good when inserted into the pipe.
     211                 :            :  */
     212                 :        825 : int generic_pipe_buf_confirm(struct pipe_inode_info *info,
     213                 :            :                              struct pipe_buffer *buf)
     214                 :            : {
     215                 :        825 :         return 0;
     216                 :            : }
     217                 :            : EXPORT_SYMBOL(generic_pipe_buf_confirm);
     218                 :            : 
     219                 :            : /**
     220                 :            :  * generic_pipe_buf_release - put a reference to a &struct pipe_buffer
     221                 :            :  * @pipe:       the pipe that the buffer belongs to
     222                 :            :  * @buf:        the buffer to put a reference to
     223                 :            :  *
     224                 :            :  * Description:
     225                 :            :  *      This function releases a reference to @buf.
     226                 :            :  */
     227                 :          0 : void generic_pipe_buf_release(struct pipe_inode_info *pipe,
     228                 :            :                               struct pipe_buffer *buf)
     229                 :            : {
     230                 :          0 :         put_page(buf->page);
     231                 :          0 : }
     232                 :            : EXPORT_SYMBOL(generic_pipe_buf_release);
     233                 :            : 
     234                 :            : /* New data written to a pipe may be appended to a buffer with this type. */
     235                 :            : static const struct pipe_buf_operations anon_pipe_buf_ops = {
     236                 :            :         .confirm = generic_pipe_buf_confirm,
     237                 :            :         .release = anon_pipe_buf_release,
     238                 :            :         .steal = anon_pipe_buf_steal,
     239                 :            :         .get = generic_pipe_buf_get,
     240                 :            : };
     241                 :            : 
     242                 :            : static const struct pipe_buf_operations anon_pipe_buf_nomerge_ops = {
     243                 :            :         .confirm = generic_pipe_buf_confirm,
     244                 :            :         .release = anon_pipe_buf_release,
     245                 :            :         .steal = anon_pipe_buf_steal,
     246                 :            :         .get = generic_pipe_buf_get,
     247                 :            : };
     248                 :            : 
     249                 :            : static const struct pipe_buf_operations packet_pipe_buf_ops = {
     250                 :            :         .confirm = generic_pipe_buf_confirm,
     251                 :            :         .release = anon_pipe_buf_release,
     252                 :            :         .steal = anon_pipe_buf_steal,
     253                 :            :         .get = generic_pipe_buf_get,
     254                 :            : };
     255                 :            : 
     256                 :            : /**
     257                 :            :  * pipe_buf_mark_unmergeable - mark a &struct pipe_buffer as unmergeable
     258                 :            :  * @buf:        the buffer to mark
     259                 :            :  *
     260                 :            :  * Description:
     261                 :            :  *      This function ensures that no future writes will be merged into the
     262                 :            :  *      given &struct pipe_buffer. This is necessary when multiple pipe buffers
     263                 :            :  *      share the same backing page.
     264                 :            :  */
     265                 :          0 : void pipe_buf_mark_unmergeable(struct pipe_buffer *buf)
     266                 :            : {
     267         [ #  # ]:          0 :         if (buf->ops == &anon_pipe_buf_ops)
     268                 :          0 :                 buf->ops = &anon_pipe_buf_nomerge_ops;
     269                 :          0 : }
     270                 :            : 
     271                 :        101 : static bool pipe_buf_can_merge(struct pipe_buffer *buf)
     272                 :            : {
     273                 :        101 :         return buf->ops == &anon_pipe_buf_ops;
     274                 :            : }
     275                 :            : 
     276                 :            : /* Done while waiting without holding the pipe lock - thus the READ_ONCE() */
     277                 :       2505 : static inline bool pipe_readable(const struct pipe_inode_info *pipe)
     278                 :            : {
     279                 :       2505 :         unsigned int head = READ_ONCE(pipe->head);
     280                 :       2505 :         unsigned int tail = READ_ONCE(pipe->tail);
     281                 :       2505 :         unsigned int writers = READ_ONCE(pipe->writers);
     282                 :            : 
     283   [ +  -  +  -  :       2505 :         return !pipe_empty(head, tail) || !writers;
             +  +  +  + ]
     284                 :            : }
     285                 :            : 
     286                 :            : static ssize_t
     287                 :     501941 : pipe_read(struct kiocb *iocb, struct iov_iter *to)
     288                 :            : {
     289         [ +  - ]:     501941 :         size_t total_len = iov_iter_count(to);
     290                 :     501941 :         struct file *filp = iocb->ki_filp;
     291                 :     501941 :         struct pipe_inode_info *pipe = filp->private_data;
     292                 :     501941 :         bool was_full, wake_next_reader = false;
     293                 :     501941 :         ssize_t ret;
     294                 :            : 
     295                 :            :         /* Null read succeeds. */
     296         [ +  - ]:     501941 :         if (unlikely(total_len == 0))
     297                 :            :                 return 0;
     298                 :            : 
     299                 :     501941 :         ret = 0;
     300                 :     501941 :         __pipe_lock(pipe);
     301                 :            : 
     302                 :            :         /*
     303                 :            :          * We only wake up writers if the pipe was full when we started
     304                 :            :          * reading in order to avoid unnecessary wakeups.
     305                 :            :          *
     306                 :            :          * But when we do wake up writers, we do so using a sync wakeup
     307                 :            :          * (WF_SYNC), because we want them to get going and generate more
     308                 :            :          * data for us.
     309                 :            :          */
     310                 :     501941 :         was_full = pipe_full(pipe->head, pipe->tail, pipe->max_usage);
     311                 :     502776 :         for (;;) {
     312                 :     502776 :                 unsigned int head = pipe->head;
     313                 :     502776 :                 unsigned int tail = pipe->tail;
     314                 :     502776 :                 unsigned int mask = pipe->ring_size - 1;
     315                 :            : 
     316         [ +  + ]:     502776 :                 if (!pipe_empty(head, tail)) {
     317                 :        724 :                         struct pipe_buffer *buf = &pipe->bufs[tail & mask];
     318                 :        724 :                         size_t chars = buf->len;
     319                 :        724 :                         size_t written;
     320                 :        724 :                         int error;
     321                 :            : 
     322                 :        724 :                         if (chars > total_len)
     323                 :            :                                 chars = total_len;
     324                 :            : 
     325                 :        724 :                         error = pipe_buf_confirm(pipe, buf);
     326         [ -  + ]:        724 :                         if (error) {
     327         [ #  # ]:          0 :                                 if (!ret)
     328                 :          0 :                                         ret = error;
     329                 :            :                                 break;
     330                 :            :                         }
     331                 :            : 
     332                 :        724 :                         written = copy_page_to_iter(buf->page, buf->offset, chars, to);
     333         [ -  + ]:        724 :                         if (unlikely(written < chars)) {
     334         [ #  # ]:          0 :                                 if (!ret)
     335                 :          0 :                                         ret = -EFAULT;
     336                 :            :                                 break;
     337                 :            :                         }
     338                 :        724 :                         ret += chars;
     339                 :        724 :                         buf->offset += chars;
     340                 :        724 :                         buf->len -= chars;
     341                 :            : 
     342                 :            :                         /* Was it a packet buffer? Clean up and exit */
     343         [ -  + ]:        724 :                         if (buf->flags & PIPE_BUF_FLAG_PACKET) {
     344                 :          0 :                                 total_len = chars;
     345                 :          0 :                                 buf->len = 0;
     346                 :            :                         }
     347                 :            : 
     348         [ +  - ]:        724 :                         if (!buf->len) {
     349                 :        724 :                                 pipe_buf_release(pipe, buf);
     350                 :        724 :                                 spin_lock_irq(&pipe->rd_wait.lock);
     351                 :        724 :                                 tail++;
     352                 :        724 :                                 pipe->tail = tail;
     353                 :        724 :                                 spin_unlock_irq(&pipe->rd_wait.lock);
     354                 :            :                         }
     355                 :        724 :                         total_len -= chars;
     356         [ +  - ]:        724 :                         if (!total_len)
     357                 :            :                                 break;  /* common path: read succeeded */
     358         [ -  + ]:        724 :                         if (!pipe_empty(head, tail))    /* More to do? */
     359                 :          0 :                                 continue;
     360                 :            :                 }
     361                 :            : 
     362         [ +  + ]:     502776 :                 if (!pipe->writers)
     363                 :            :                         break;
     364         [ +  + ]:       1434 :                 if (ret)
     365                 :            :                         break;
     366         [ +  - ]:        835 :                 if (filp->f_flags & O_NONBLOCK) {
     367                 :            :                         ret = -EAGAIN;
     368                 :            :                         break;
     369                 :            :                 }
     370                 :        835 :                 __pipe_unlock(pipe);
     371                 :            : 
     372                 :            :                 /*
     373                 :            :                  * We only get here if we didn't actually read anything.
     374                 :            :                  *
     375                 :            :                  * However, we could have seen (and removed) a zero-sized
     376                 :            :                  * pipe buffer, and might have made space in the buffers
     377                 :            :                  * that way.
     378                 :            :                  *
     379                 :            :                  * You can't make zero-sized pipe buffers by doing an empty
     380                 :            :                  * write (not even in packet mode), but they can happen if
     381                 :            :                  * the writer gets an EFAULT when trying to fill a buffer
     382                 :            :                  * that already got allocated and inserted in the buffer
     383                 :            :                  * array.
     384                 :            :                  *
     385                 :            :                  * So we still need to wake up any pending writers in the
     386                 :            :                  * _very_ unlikely case that the pipe was full, but we got
     387                 :            :                  * no data.
     388                 :            :                  */
     389         [ -  + ]:        835 :                 if (unlikely(was_full)) {
     390                 :          0 :                         wake_up_interruptible_sync_poll(&pipe->wr_wait, EPOLLOUT | EPOLLWRNORM);
     391                 :          0 :                         kill_fasync(&pipe->fasync_writers, SIGIO, POLL_OUT);
     392                 :            :                 }
     393                 :            : 
     394                 :            :                 /*
     395                 :            :                  * But because we didn't read anything, at this point we can
     396                 :            :                  * just return directly with -ERESTARTSYS if we're interrupted,
     397                 :            :                  * since we've done any required wakeups and there's no need
     398                 :            :                  * to mark anything accessed. And we've dropped the lock.
     399                 :            :                  */
     400   [ +  -  +  -  :       3340 :                 if (wait_event_interruptible_exclusive(pipe->rd_wait, pipe_readable(pipe)) < 0)
          +  +  +  +  -  
                +  +  - ]
     401                 :            :                         return -ERESTARTSYS;
     402                 :            : 
     403                 :        835 :                 __pipe_lock(pipe);
     404                 :        835 :                 was_full = pipe_full(pipe->head, pipe->tail, pipe->max_usage);
     405                 :        835 :                 wake_next_reader = true;
     406                 :            :         }
     407         [ +  - ]:     501941 :         if (pipe_empty(pipe->head, pipe->tail))
     408                 :     501941 :                 wake_next_reader = false;
     409                 :     501941 :         __pipe_unlock(pipe);
     410                 :            : 
     411         [ -  + ]:     501941 :         if (was_full) {
     412                 :          0 :                 wake_up_interruptible_sync_poll(&pipe->wr_wait, EPOLLOUT | EPOLLWRNORM);
     413                 :          0 :                 kill_fasync(&pipe->fasync_writers, SIGIO, POLL_OUT);
     414                 :            :         }
     415         [ -  + ]:     501941 :         if (wake_next_reader)
     416                 :          0 :                 wake_up_interruptible_sync_poll(&pipe->rd_wait, EPOLLIN | EPOLLRDNORM);
     417         [ +  + ]:     501941 :         if (ret > 0)
     418         [ +  - ]:        724 :                 file_accessed(filp);
     419                 :            :         return ret;
     420                 :            : }
     421                 :            : 
     422                 :        724 : static inline int is_packetized(struct file *file)
     423                 :            : {
     424                 :        724 :         return (file->f_flags & O_DIRECT) != 0;
     425                 :            : }
     426                 :            : 
     427                 :            : /* Done while waiting without holding the pipe lock - thus the READ_ONCE() */
     428                 :          0 : static inline bool pipe_writable(const struct pipe_inode_info *pipe)
     429                 :            : {
     430                 :          0 :         unsigned int head = READ_ONCE(pipe->head);
     431                 :          0 :         unsigned int tail = READ_ONCE(pipe->tail);
     432                 :          0 :         unsigned int max_usage = READ_ONCE(pipe->max_usage);
     433                 :            : 
     434   [ #  #  #  #  :          0 :         return !pipe_full(head, tail, max_usage) ||
             #  #  #  # ]
     435   [ #  #  #  # ]:          0 :                 !READ_ONCE(pipe->readers);
     436                 :            : }
     437                 :            : 
     438                 :            : static ssize_t
     439                 :        825 : pipe_write(struct kiocb *iocb, struct iov_iter *from)
     440                 :            : {
     441                 :        825 :         struct file *filp = iocb->ki_filp;
     442                 :        825 :         struct pipe_inode_info *pipe = filp->private_data;
     443                 :        825 :         unsigned int head;
     444                 :        825 :         ssize_t ret = 0;
     445         [ +  - ]:        825 :         size_t total_len = iov_iter_count(from);
     446                 :        825 :         ssize_t chars;
     447                 :        825 :         bool was_empty = false;
     448                 :        825 :         bool wake_next_writer = false;
     449                 :            : 
     450                 :            :         /* Null write succeeds. */
     451         [ +  - ]:        825 :         if (unlikely(total_len == 0))
     452                 :            :                 return 0;
     453                 :            : 
     454                 :        825 :         __pipe_lock(pipe);
     455                 :            : 
     456         [ -  + ]:        825 :         if (!pipe->readers) {
     457                 :          0 :                 send_sig(SIGPIPE, current, 0);
     458                 :          0 :                 ret = -EPIPE;
     459                 :          0 :                 goto out;
     460                 :            :         }
     461                 :            : 
     462                 :            :         /*
     463                 :            :          * Only wake up if the pipe started out empty, since
     464                 :            :          * otherwise there should be no readers waiting.
     465                 :            :          *
     466                 :            :          * If it wasn't empty we try to merge new data into
     467                 :            :          * the last buffer.
     468                 :            :          *
     469                 :            :          * That naturally merges small writes, but it also
     470                 :            :          * page-aligs the rest of the writes for large writes
     471                 :            :          * spanning multiple pages.
     472                 :            :          */
     473                 :        825 :         head = pipe->head;
     474         [ +  + ]:        825 :         was_empty = pipe_empty(head, pipe->tail);
     475                 :        825 :         chars = total_len & (PAGE_SIZE-1);
     476         [ +  + ]:        825 :         if (chars && !was_empty) {
     477                 :        101 :                 unsigned int mask = pipe->ring_size - 1;
     478                 :        101 :                 struct pipe_buffer *buf = &pipe->bufs[(head - 1) & mask];
     479                 :        101 :                 int offset = buf->offset + buf->len;
     480                 :            : 
     481   [ -  +  -  + ]:        101 :                 if (pipe_buf_can_merge(buf) && offset + chars <= PAGE_SIZE) {
     482                 :        101 :                         ret = pipe_buf_confirm(pipe, buf);
     483         [ -  + ]:        101 :                         if (ret)
     484                 :          0 :                                 goto out;
     485                 :            : 
     486                 :        101 :                         ret = copy_page_from_iter(buf->page, offset, chars, from);
     487         [ -  + ]:        101 :                         if (unlikely(ret < chars)) {
     488                 :          0 :                                 ret = -EFAULT;
     489                 :          0 :                                 goto out;
     490                 :            :                         }
     491                 :            : 
     492                 :        101 :                         buf->len += ret;
     493         [ -  + ]:        101 :                         if (!iov_iter_count(from))
     494                 :        101 :                                 goto out;
     495                 :            :                 }
     496                 :            :         }
     497                 :            : 
     498                 :        724 :         for (;;) {
     499         [ -  + ]:        724 :                 if (!pipe->readers) {
     500                 :          0 :                         send_sig(SIGPIPE, current, 0);
     501         [ #  # ]:          0 :                         if (!ret)
     502                 :          0 :                                 ret = -EPIPE;
     503                 :            :                         break;
     504                 :            :                 }
     505                 :            : 
     506                 :        724 :                 head = pipe->head;
     507         [ +  - ]:        724 :                 if (!pipe_full(head, pipe->tail, pipe->max_usage)) {
     508                 :        724 :                         unsigned int mask = pipe->ring_size - 1;
     509                 :        724 :                         struct pipe_buffer *buf = &pipe->bufs[head & mask];
     510                 :        724 :                         struct page *page = pipe->tmp_page;
     511                 :        724 :                         int copied;
     512                 :            : 
     513         [ +  + ]:        724 :                         if (!page) {
     514                 :        669 :                                 page = alloc_page(GFP_HIGHUSER | __GFP_ACCOUNT);
     515         [ -  + ]:        669 :                                 if (unlikely(!page)) {
     516         [ #  # ]:          0 :                                         ret = ret ? : -ENOMEM;
     517                 :            :                                         break;
     518                 :            :                                 }
     519                 :        669 :                                 pipe->tmp_page = page;
     520                 :            :                         }
     521                 :            : 
     522                 :            :                         /* Allocate a slot in the ring in advance and attach an
     523                 :            :                          * empty buffer.  If we fault or otherwise fail to use
     524                 :            :                          * it, either the reader will consume it or it'll still
     525                 :            :                          * be there for the next write.
     526                 :            :                          */
     527                 :        724 :                         spin_lock_irq(&pipe->rd_wait.lock);
     528                 :            : 
     529                 :        724 :                         head = pipe->head;
     530         [ -  + ]:        724 :                         if (pipe_full(head, pipe->tail, pipe->max_usage)) {
     531                 :          0 :                                 spin_unlock_irq(&pipe->rd_wait.lock);
     532                 :          0 :                                 continue;
     533                 :            :                         }
     534                 :            : 
     535                 :        724 :                         pipe->head = head + 1;
     536                 :        724 :                         spin_unlock_irq(&pipe->rd_wait.lock);
     537                 :            : 
     538                 :            :                         /* Insert it into the buffer array */
     539                 :        724 :                         buf = &pipe->bufs[head & mask];
     540                 :        724 :                         buf->page = page;
     541                 :        724 :                         buf->ops = &anon_pipe_buf_ops;
     542                 :        724 :                         buf->offset = 0;
     543                 :        724 :                         buf->len = 0;
     544                 :        724 :                         buf->flags = 0;
     545         [ -  + ]:        724 :                         if (is_packetized(filp)) {
     546                 :          0 :                                 buf->ops = &packet_pipe_buf_ops;
     547                 :          0 :                                 buf->flags = PIPE_BUF_FLAG_PACKET;
     548                 :            :                         }
     549                 :        724 :                         pipe->tmp_page = NULL;
     550                 :            : 
     551                 :        724 :                         copied = copy_page_from_iter(page, 0, PAGE_SIZE, from);
     552   [ +  -  -  + ]:        724 :                         if (unlikely(copied < PAGE_SIZE && iov_iter_count(from))) {
     553         [ #  # ]:          0 :                                 if (!ret)
     554                 :          0 :                                         ret = -EFAULT;
     555                 :            :                                 break;
     556                 :            :                         }
     557                 :        724 :                         ret += copied;
     558                 :        724 :                         buf->offset = 0;
     559                 :        724 :                         buf->len = copied;
     560                 :            : 
     561         [ -  + ]:        724 :                         if (!iov_iter_count(from))
     562                 :            :                                 break;
     563                 :            :                 }
     564                 :            : 
     565         [ #  # ]:          0 :                 if (!pipe_full(head, pipe->tail, pipe->max_usage))
     566                 :          0 :                         continue;
     567                 :            : 
     568                 :            :                 /* Wait for buffer space to become available. */
     569         [ #  # ]:          0 :                 if (filp->f_flags & O_NONBLOCK) {
     570         [ #  # ]:          0 :                         if (!ret)
     571                 :          0 :                                 ret = -EAGAIN;
     572                 :            :                         break;
     573                 :            :                 }
     574         [ #  # ]:          0 :                 if (signal_pending(current)) {
     575         [ #  # ]:          0 :                         if (!ret)
     576                 :          0 :                                 ret = -ERESTARTSYS;
     577                 :            :                         break;
     578                 :            :                 }
     579                 :            : 
     580                 :            :                 /*
     581                 :            :                  * We're going to release the pipe lock and wait for more
     582                 :            :                  * space. We wake up any readers if necessary, and then
     583                 :            :                  * after waiting we need to re-check whether the pipe
     584                 :            :                  * become empty while we dropped the lock.
     585                 :            :                  */
     586                 :          0 :                 __pipe_unlock(pipe);
     587         [ #  # ]:          0 :                 if (was_empty) {
     588                 :          0 :                         wake_up_interruptible_sync_poll(&pipe->rd_wait, EPOLLIN | EPOLLRDNORM);
     589                 :          0 :                         kill_fasync(&pipe->fasync_readers, SIGIO, POLL_IN);
     590                 :            :                 }
     591   [ #  #  #  #  :          0 :                 wait_event_interruptible_exclusive(pipe->wr_wait, pipe_writable(pipe));
          #  #  #  #  #  
                      # ]
     592                 :          0 :                 __pipe_lock(pipe);
     593                 :          0 :                 was_empty = pipe_empty(pipe->head, pipe->tail);
     594                 :          0 :                 wake_next_writer = true;
     595                 :            :         }
     596                 :        724 : out:
     597         [ -  + ]:        825 :         if (pipe_full(pipe->head, pipe->tail, pipe->max_usage))
     598                 :          0 :                 wake_next_writer = false;
     599                 :        825 :         __pipe_unlock(pipe);
     600                 :            : 
     601                 :            :         /*
     602                 :            :          * If we do do a wakeup event, we do a 'sync' wakeup, because we
     603                 :            :          * want the reader to start processing things asap, rather than
     604                 :            :          * leave the data pending.
     605                 :            :          *
     606                 :            :          * This is particularly important for small writes, because of
     607                 :            :          * how (for example) the GNU make jobserver uses small writes to
     608                 :            :          * wake up pending jobs
     609                 :            :          */
     610         [ +  + ]:        825 :         if (was_empty) {
     611                 :        724 :                 wake_up_interruptible_sync_poll(&pipe->rd_wait, EPOLLIN | EPOLLRDNORM);
     612                 :        724 :                 kill_fasync(&pipe->fasync_readers, SIGIO, POLL_IN);
     613                 :            :         }
     614         [ -  + ]:        825 :         if (wake_next_writer)
     615                 :          0 :                 wake_up_interruptible_sync_poll(&pipe->wr_wait, EPOLLOUT | EPOLLWRNORM);
     616   [ +  -  +  - ]:        825 :         if (ret > 0 && sb_start_write_trylock(file_inode(filp)->i_sb)) {
     617                 :        825 :                 int err = file_update_time(filp);
     618         [ -  + ]:        825 :                 if (err)
     619                 :          0 :                         ret = err;
     620                 :        825 :                 sb_end_write(file_inode(filp)->i_sb);
     621                 :            :         }
     622                 :            :         return ret;
     623                 :            : }
     624                 :            : 
     625                 :        801 : static long pipe_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)
     626                 :            : {
     627                 :        801 :         struct pipe_inode_info *pipe = filp->private_data;
     628                 :        801 :         int count, head, tail, mask;
     629                 :            : 
     630         [ -  + ]:        801 :         switch (cmd) {
     631                 :            :                 case FIONREAD:
     632                 :          0 :                         __pipe_lock(pipe);
     633                 :          0 :                         count = 0;
     634                 :          0 :                         head = pipe->head;
     635                 :          0 :                         tail = pipe->tail;
     636                 :          0 :                         mask = pipe->ring_size - 1;
     637                 :            : 
     638         [ #  # ]:          0 :                         while (tail != head) {
     639                 :          0 :                                 count += pipe->bufs[tail & mask].len;
     640                 :          0 :                                 tail++;
     641                 :            :                         }
     642                 :          0 :                         __pipe_unlock(pipe);
     643                 :            : 
     644                 :          0 :                         return put_user(count, (int __user *)arg);
     645                 :            :                 default:
     646                 :            :                         return -ENOIOCTLCMD;
     647                 :            :         }
     648                 :            : }
     649                 :            : 
     650                 :            : /* No kernel lock held - fine */
     651                 :            : static __poll_t
     652                 :     505361 : pipe_poll(struct file *filp, poll_table *wait)
     653                 :            : {
     654                 :     505361 :         __poll_t mask;
     655                 :     505361 :         struct pipe_inode_info *pipe = filp->private_data;
     656                 :     505361 :         unsigned int head, tail;
     657                 :            : 
     658                 :            :         /*
     659                 :            :          * Reading pipe state only -- no need for acquiring the semaphore.
     660                 :            :          *
     661                 :            :          * But because this is racy, the code has to add the
     662                 :            :          * entry to the poll table _first_ ..
     663                 :            :          */
     664         [ +  - ]:     505361 :         if (filp->f_mode & FMODE_READ)
     665         [ +  - ]:     505361 :                 poll_wait(filp, &pipe->rd_wait, wait);
     666         [ +  + ]:     505361 :         if (filp->f_mode & FMODE_WRITE)
     667         [ +  - ]:         78 :                 poll_wait(filp, &pipe->wr_wait, wait);
     668                 :            : 
     669                 :            :         /*
     670                 :            :          * .. and only then can you do the racy tests. That way,
     671                 :            :          * if something changes and you got it wrong, the poll
     672                 :            :          * table entry will wake you up and fix it.
     673                 :            :          */
     674         [ +  - ]:     505361 :         head = READ_ONCE(pipe->head);
     675                 :     505361 :         tail = READ_ONCE(pipe->tail);
     676                 :            : 
     677                 :     505361 :         mask = 0;
     678         [ +  - ]:     505361 :         if (filp->f_mode & FMODE_READ) {
     679         [ +  + ]:     505361 :                 if (!pipe_empty(head, tail))
     680                 :        312 :                         mask |= EPOLLIN | EPOLLRDNORM;
     681   [ +  +  +  - ]:     505361 :                 if (!pipe->writers && filp->f_version != pipe->w_counter)
     682                 :     502983 :                         mask |= EPOLLHUP;
     683                 :            :         }
     684                 :            : 
     685         [ +  + ]:     505361 :         if (filp->f_mode & FMODE_WRITE) {
     686         [ +  - ]:         78 :                 if (!pipe_full(head, tail, pipe->max_usage))
     687                 :         78 :                         mask |= EPOLLOUT | EPOLLWRNORM;
     688                 :            :                 /*
     689                 :            :                  * Most Unices do not set EPOLLERR for FIFOs but on Linux they
     690                 :            :                  * behave exactly like pipes for poll().
     691                 :            :                  */
     692         [ -  + ]:         78 :                 if (!pipe->readers)
     693                 :          0 :                         mask |= EPOLLERR;
     694                 :            :         }
     695                 :            : 
     696                 :     505361 :         return mask;
     697                 :            : }
     698                 :            : 
     699                 :       4164 : static void put_pipe_info(struct inode *inode, struct pipe_inode_info *pipe)
     700                 :            : {
     701                 :       4164 :         int kill = 0;
     702                 :            : 
     703                 :       4164 :         spin_lock(&inode->i_lock);
     704         [ +  + ]:       4164 :         if (!--pipe->files) {
     705                 :       2082 :                 inode->i_pipe = NULL;
     706                 :       2082 :                 kill = 1;
     707                 :            :         }
     708                 :       4164 :         spin_unlock(&inode->i_lock);
     709                 :            : 
     710         [ +  + ]:       4164 :         if (kill)
     711                 :       2082 :                 free_pipe_info(pipe);
     712                 :       4164 : }
     713                 :            : 
     714                 :            : static int
     715                 :       4164 : pipe_release(struct inode *inode, struct file *file)
     716                 :            : {
     717                 :       4164 :         struct pipe_inode_info *pipe = file->private_data;
     718                 :            : 
     719                 :       4164 :         __pipe_lock(pipe);
     720         [ +  + ]:       4164 :         if (file->f_mode & FMODE_READ)
     721                 :       2082 :                 pipe->readers--;
     722         [ +  + ]:       4164 :         if (file->f_mode & FMODE_WRITE)
     723                 :       2082 :                 pipe->writers--;
     724                 :            : 
     725                 :            :         /* Was that the last reader or writer, but not the other side? */
     726         [ +  + ]:       4164 :         if (!pipe->readers != !pipe->writers) {
     727                 :       2082 :                 wake_up_interruptible_all(&pipe->rd_wait);
     728                 :       2082 :                 wake_up_interruptible_all(&pipe->wr_wait);
     729                 :       2082 :                 kill_fasync(&pipe->fasync_readers, SIGIO, POLL_IN);
     730                 :       2082 :                 kill_fasync(&pipe->fasync_writers, SIGIO, POLL_OUT);
     731                 :            :         }
     732                 :       4164 :         __pipe_unlock(pipe);
     733                 :            : 
     734                 :       4164 :         put_pipe_info(inode, pipe);
     735                 :       4164 :         return 0;
     736                 :            : }
     737                 :            : 
     738                 :            : static int
     739                 :          0 : pipe_fasync(int fd, struct file *filp, int on)
     740                 :            : {
     741                 :          0 :         struct pipe_inode_info *pipe = filp->private_data;
     742                 :          0 :         int retval = 0;
     743                 :            : 
     744                 :          0 :         __pipe_lock(pipe);
     745         [ #  # ]:          0 :         if (filp->f_mode & FMODE_READ)
     746                 :          0 :                 retval = fasync_helper(fd, filp, on, &pipe->fasync_readers);
     747   [ #  #  #  # ]:          0 :         if ((filp->f_mode & FMODE_WRITE) && retval >= 0) {
     748                 :          0 :                 retval = fasync_helper(fd, filp, on, &pipe->fasync_writers);
     749   [ #  #  #  # ]:          0 :                 if (retval < 0 && (filp->f_mode & FMODE_READ))
     750                 :            :                         /* this can happen only if on == T */
     751                 :          0 :                         fasync_helper(-1, filp, 0, &pipe->fasync_readers);
     752                 :            :         }
     753                 :          0 :         __pipe_unlock(pipe);
     754                 :          0 :         return retval;
     755                 :            : }
     756                 :            : 
     757                 :       4632 : static unsigned long account_pipe_buffers(struct user_struct *user,
     758                 :            :                                  unsigned long old, unsigned long new)
     759                 :            : {
     760                 :       7104 :         return atomic_long_add_return(new - old, &user->pipe_bufs);
     761                 :            : }
     762                 :            : 
     763                 :       2472 : static bool too_many_pipe_buffers_soft(unsigned long user_bufs)
     764                 :            : {
     765         [ #  # ]:          0 :         unsigned long soft_limit = READ_ONCE(pipe_user_pages_soft);
     766                 :            : 
     767         [ -  + ]:       2472 :         return soft_limit && user_bufs > soft_limit;
     768                 :            : }
     769                 :            : 
     770                 :       2472 : static bool too_many_pipe_buffers_hard(unsigned long user_bufs)
     771                 :            : {
     772         [ #  # ]:          0 :         unsigned long hard_limit = READ_ONCE(pipe_user_pages_hard);
     773                 :            : 
     774         [ -  + ]:       2472 :         return hard_limit && user_bufs > hard_limit;
     775                 :            : }
     776                 :            : 
     777                 :          0 : static bool is_unprivileged_user(void)
     778                 :            : {
     779   [ #  #  #  # ]:          0 :         return !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN);
     780                 :            : }
     781                 :            : 
     782                 :       2472 : struct pipe_inode_info *alloc_pipe_info(void)
     783                 :            : {
     784                 :       2472 :         struct pipe_inode_info *pipe;
     785                 :       2472 :         unsigned long pipe_bufs = PIPE_DEF_BUFFERS;
     786                 :       2472 :         struct user_struct *user = get_current_user();
     787                 :       2472 :         unsigned long user_bufs;
     788                 :       2472 :         unsigned int max_size = READ_ONCE(pipe_max_size);
     789                 :            : 
     790                 :       2472 :         pipe = kzalloc(sizeof(struct pipe_inode_info), GFP_KERNEL_ACCOUNT);
     791         [ -  + ]:       2472 :         if (pipe == NULL)
     792                 :          0 :                 goto out_free_uid;
     793                 :            : 
     794   [ -  +  -  - ]:       2472 :         if (pipe_bufs * PAGE_SIZE > max_size && !capable(CAP_SYS_RESOURCE))
     795                 :          0 :                 pipe_bufs = max_size >> PAGE_SHIFT;
     796                 :            : 
     797                 :       2472 :         user_bufs = account_pipe_buffers(user, 0, pipe_bufs);
     798                 :            : 
     799   [ -  +  -  - ]:       2472 :         if (too_many_pipe_buffers_soft(user_bufs) && is_unprivileged_user()) {
     800                 :          0 :                 user_bufs = account_pipe_buffers(user, pipe_bufs, 1);
     801                 :          0 :                 pipe_bufs = 1;
     802                 :            :         }
     803                 :            : 
     804   [ -  +  -  - ]:       2472 :         if (too_many_pipe_buffers_hard(user_bufs) && is_unprivileged_user())
     805                 :          0 :                 goto out_revert_acct;
     806                 :            : 
     807                 :       2472 :         pipe->bufs = kcalloc(pipe_bufs, sizeof(struct pipe_buffer),
     808                 :            :                              GFP_KERNEL_ACCOUNT);
     809                 :            : 
     810         [ +  - ]:       2472 :         if (pipe->bufs) {
     811                 :       2472 :                 init_waitqueue_head(&pipe->rd_wait);
     812                 :       2472 :                 init_waitqueue_head(&pipe->wr_wait);
     813                 :       2472 :                 pipe->r_counter = pipe->w_counter = 1;
     814                 :       2472 :                 pipe->max_usage = pipe_bufs;
     815                 :       2472 :                 pipe->ring_size = pipe_bufs;
     816                 :       2472 :                 pipe->user = user;
     817                 :       2472 :                 mutex_init(&pipe->mutex);
     818                 :       2472 :                 return pipe;
     819                 :            :         }
     820                 :            : 
     821                 :          0 : out_revert_acct:
     822                 :          0 :         (void) account_pipe_buffers(user, pipe_bufs, 0);
     823                 :          0 :         kfree(pipe);
     824                 :          0 : out_free_uid:
     825                 :          0 :         free_uid(user);
     826                 :          0 :         return NULL;
     827                 :            : }
     828                 :            : 
     829                 :       2160 : void free_pipe_info(struct pipe_inode_info *pipe)
     830                 :            : {
     831                 :       2160 :         int i;
     832                 :            : 
     833                 :       2160 :         (void) account_pipe_buffers(pipe->user, pipe->ring_size, 0);
     834                 :       2160 :         free_uid(pipe->user);
     835         [ +  + ]:      38880 :         for (i = 0; i < pipe->ring_size; i++) {
     836                 :      34560 :                 struct pipe_buffer *buf = pipe->bufs + i;
     837         [ -  + ]:      34560 :                 if (buf->ops)
     838                 :          0 :                         pipe_buf_release(pipe, buf);
     839                 :            :         }
     840         [ +  + ]:       2160 :         if (pipe->tmp_page)
     841                 :        669 :                 __free_page(pipe->tmp_page);
     842                 :       2160 :         kfree(pipe->bufs);
     843                 :       2160 :         kfree(pipe);
     844                 :       2160 : }
     845                 :            : 
     846                 :            : static struct vfsmount *pipe_mnt __read_mostly;
     847                 :            : 
     848                 :            : /*
     849                 :            :  * pipefs_dname() is called from d_path().
     850                 :            :  */
     851                 :          0 : static char *pipefs_dname(struct dentry *dentry, char *buffer, int buflen)
     852                 :            : {
     853                 :          0 :         return dynamic_dname(dentry, buffer, buflen, "pipe:[%lu]",
     854                 :          0 :                                 d_inode(dentry)->i_ino);
     855                 :            : }
     856                 :            : 
     857                 :            : static const struct dentry_operations pipefs_dentry_operations = {
     858                 :            :         .d_dname        = pipefs_dname,
     859                 :            : };
     860                 :            : 
     861                 :       2316 : static struct inode * get_pipe_inode(void)
     862                 :            : {
     863                 :       2316 :         struct inode *inode = new_inode_pseudo(pipe_mnt->mnt_sb);
     864                 :       2316 :         struct pipe_inode_info *pipe;
     865                 :            : 
     866         [ -  + ]:       2316 :         if (!inode)
     867                 :          0 :                 goto fail_inode;
     868                 :            : 
     869                 :       2316 :         inode->i_ino = get_next_ino();
     870                 :            : 
     871                 :       2316 :         pipe = alloc_pipe_info();
     872         [ -  + ]:       2316 :         if (!pipe)
     873                 :          0 :                 goto fail_iput;
     874                 :            : 
     875                 :       2316 :         inode->i_pipe = pipe;
     876                 :       2316 :         pipe->files = 2;
     877                 :       2316 :         pipe->readers = pipe->writers = 1;
     878                 :       2316 :         inode->i_fop = &pipefifo_fops;
     879                 :            : 
     880                 :            :         /*
     881                 :            :          * Mark the inode dirty from the very beginning,
     882                 :            :          * that way it will never be moved to the dirty
     883                 :            :          * list because "mark_inode_dirty()" will think
     884                 :            :          * that it already _is_ on the dirty list.
     885                 :            :          */
     886                 :       2316 :         inode->i_state = I_DIRTY;
     887                 :       2316 :         inode->i_mode = S_IFIFO | S_IRUSR | S_IWUSR;
     888                 :       2316 :         inode->i_uid = current_fsuid();
     889                 :       2316 :         inode->i_gid = current_fsgid();
     890                 :       2316 :         inode->i_atime = inode->i_mtime = inode->i_ctime = current_time(inode);
     891                 :            : 
     892                 :       2316 :         return inode;
     893                 :            : 
     894                 :            : fail_iput:
     895                 :          0 :         iput(inode);
     896                 :            : 
     897                 :            : fail_inode:
     898                 :            :         return NULL;
     899                 :            : }
     900                 :            : 
     901                 :       2316 : int create_pipe_files(struct file **res, int flags)
     902                 :            : {
     903                 :       2316 :         struct inode *inode = get_pipe_inode();
     904                 :       2316 :         struct file *f;
     905                 :            : 
     906         [ +  - ]:       2316 :         if (!inode)
     907                 :            :                 return -ENFILE;
     908                 :            : 
     909                 :       2316 :         f = alloc_file_pseudo(inode, pipe_mnt, "",
     910                 :       2316 :                                 O_WRONLY | (flags & (O_NONBLOCK | O_DIRECT)),
     911                 :            :                                 &pipefifo_fops);
     912         [ -  + ]:       2316 :         if (IS_ERR(f)) {
     913                 :          0 :                 free_pipe_info(inode->i_pipe);
     914                 :          0 :                 iput(inode);
     915                 :          0 :                 return PTR_ERR(f);
     916                 :            :         }
     917                 :            : 
     918                 :       2316 :         f->private_data = inode->i_pipe;
     919                 :            : 
     920                 :       2316 :         res[0] = alloc_file_clone(f, O_RDONLY | (flags & O_NONBLOCK),
     921                 :            :                                   &pipefifo_fops);
     922         [ -  + ]:       2316 :         if (IS_ERR(res[0])) {
     923                 :          0 :                 put_pipe_info(inode, inode->i_pipe);
     924                 :          0 :                 fput(f);
     925                 :          0 :                 return PTR_ERR(res[0]);
     926                 :            :         }
     927                 :       2316 :         res[0]->private_data = inode->i_pipe;
     928                 :       2316 :         res[1] = f;
     929                 :       2316 :         stream_open(inode, res[0]);
     930                 :       2316 :         stream_open(inode, res[1]);
     931                 :       2316 :         return 0;
     932                 :            : }
     933                 :            : 
     934                 :       2316 : static int __do_pipe_flags(int *fd, struct file **files, int flags)
     935                 :            : {
     936                 :       2316 :         int error;
     937                 :       2316 :         int fdw, fdr;
     938                 :            : 
     939         [ +  - ]:       2316 :         if (flags & ~(O_CLOEXEC | O_NONBLOCK | O_DIRECT))
     940                 :            :                 return -EINVAL;
     941                 :            : 
     942                 :       2316 :         error = create_pipe_files(files, flags);
     943         [ +  - ]:       2316 :         if (error)
     944                 :            :                 return error;
     945                 :            : 
     946                 :       2316 :         error = get_unused_fd_flags(flags);
     947         [ -  + ]:       2316 :         if (error < 0)
     948                 :          0 :                 goto err_read_pipe;
     949                 :       2316 :         fdr = error;
     950                 :            : 
     951                 :       2316 :         error = get_unused_fd_flags(flags);
     952         [ -  + ]:       2316 :         if (error < 0)
     953                 :          0 :                 goto err_fdr;
     954                 :       2316 :         fdw = error;
     955                 :            : 
     956                 :       2316 :         audit_fd_pair(fdr, fdw);
     957                 :       2316 :         fd[0] = fdr;
     958                 :       2316 :         fd[1] = fdw;
     959                 :       2316 :         return 0;
     960                 :            : 
     961                 :            :  err_fdr:
     962                 :          0 :         put_unused_fd(fdr);
     963                 :          0 :  err_read_pipe:
     964                 :          0 :         fput(files[0]);
     965                 :          0 :         fput(files[1]);
     966                 :          0 :         return error;
     967                 :            : }
     968                 :            : 
     969                 :          0 : int do_pipe_flags(int *fd, int flags)
     970                 :            : {
     971                 :          0 :         struct file *files[2];
     972                 :          0 :         int error = __do_pipe_flags(fd, files, flags);
     973         [ #  # ]:          0 :         if (!error) {
     974                 :          0 :                 fd_install(fd[0], files[0]);
     975                 :          0 :                 fd_install(fd[1], files[1]);
     976                 :            :         }
     977                 :          0 :         return error;
     978                 :            : }
     979                 :            : 
     980                 :            : /*
     981                 :            :  * sys_pipe() is the normal C calling standard for creating
     982                 :            :  * a pipe. It's not the way Unix traditionally does this, though.
     983                 :            :  */
     984                 :       2316 : static int do_pipe2(int __user *fildes, int flags)
     985                 :            : {
     986                 :       2316 :         struct file *files[2];
     987                 :       2316 :         int fd[2];
     988                 :       2316 :         int error;
     989                 :            : 
     990                 :       2316 :         error = __do_pipe_flags(fd, files, flags);
     991         [ +  - ]:       2316 :         if (!error) {
     992         [ -  + ]:       2316 :                 if (unlikely(copy_to_user(fildes, fd, sizeof(fd)))) {
     993                 :          0 :                         fput(files[0]);
     994                 :          0 :                         fput(files[1]);
     995                 :          0 :                         put_unused_fd(fd[0]);
     996                 :          0 :                         put_unused_fd(fd[1]);
     997                 :          0 :                         error = -EFAULT;
     998                 :            :                 } else {
     999                 :       2316 :                         fd_install(fd[0], files[0]);
    1000                 :       2316 :                         fd_install(fd[1], files[1]);
    1001                 :            :                 }
    1002                 :            :         }
    1003                 :       2316 :         return error;
    1004                 :            : }
    1005                 :            : 
    1006                 :       3540 : SYSCALL_DEFINE2(pipe2, int __user *, fildes, int, flags)
    1007                 :            : {
    1008                 :       1770 :         return do_pipe2(fildes, flags);
    1009                 :            : }
    1010                 :            : 
    1011                 :       1092 : SYSCALL_DEFINE1(pipe, int __user *, fildes)
    1012                 :            : {
    1013                 :        546 :         return do_pipe2(fildes, 0);
    1014                 :            : }
    1015                 :            : 
    1016                 :          0 : static int wait_for_partner(struct pipe_inode_info *pipe, unsigned int *cnt)
    1017                 :            : {
    1018                 :          0 :         int cur = *cnt;
    1019                 :            : 
    1020         [ #  # ]:          0 :         while (cur == *cnt) {
    1021                 :          0 :                 pipe_wait(pipe);
    1022         [ #  # ]:          0 :                 if (signal_pending(current))
    1023                 :            :                         break;
    1024                 :            :         }
    1025         [ #  # ]:          0 :         return cur == *cnt ? -ERESTARTSYS : 0;
    1026                 :            : }
    1027                 :            : 
    1028                 :         78 : static void wake_up_partner(struct pipe_inode_info *pipe)
    1029                 :            : {
    1030                 :         78 :         wake_up_interruptible_all(&pipe->rd_wait);
    1031                 :         78 :         wake_up_interruptible_all(&pipe->wr_wait);
    1032                 :         78 : }
    1033                 :            : 
    1034                 :         78 : static int fifo_open(struct inode *inode, struct file *filp)
    1035                 :            : {
    1036                 :         78 :         struct pipe_inode_info *pipe;
    1037                 :         78 :         bool is_pipe = inode->i_sb->s_magic == PIPEFS_MAGIC;
    1038                 :         78 :         int ret;
    1039                 :            : 
    1040                 :         78 :         filp->f_version = 0;
    1041                 :            : 
    1042                 :         78 :         spin_lock(&inode->i_lock);
    1043         [ -  + ]:         78 :         if (inode->i_pipe) {
    1044                 :          0 :                 pipe = inode->i_pipe;
    1045                 :          0 :                 pipe->files++;
    1046                 :          0 :                 spin_unlock(&inode->i_lock);
    1047                 :            :         } else {
    1048                 :         78 :                 spin_unlock(&inode->i_lock);
    1049                 :         78 :                 pipe = alloc_pipe_info();
    1050         [ +  - ]:         78 :                 if (!pipe)
    1051                 :            :                         return -ENOMEM;
    1052                 :         78 :                 pipe->files = 1;
    1053                 :         78 :                 spin_lock(&inode->i_lock);
    1054         [ -  + ]:         78 :                 if (unlikely(inode->i_pipe)) {
    1055                 :          0 :                         inode->i_pipe->files++;
    1056                 :          0 :                         spin_unlock(&inode->i_lock);
    1057                 :          0 :                         free_pipe_info(pipe);
    1058                 :          0 :                         pipe = inode->i_pipe;
    1059                 :            :                 } else {
    1060                 :         78 :                         inode->i_pipe = pipe;
    1061                 :         78 :                         spin_unlock(&inode->i_lock);
    1062                 :            :                 }
    1063                 :            :         }
    1064                 :         78 :         filp->private_data = pipe;
    1065                 :            :         /* OK, we have a pipe and it's pinned down */
    1066                 :            : 
    1067                 :         78 :         __pipe_lock(pipe);
    1068                 :            : 
    1069                 :            :         /* We can only do regular read/write on fifos */
    1070                 :         78 :         stream_open(inode, filp);
    1071                 :            : 
    1072   [ -  -  +  - ]:         78 :         switch (filp->f_mode & (FMODE_READ | FMODE_WRITE)) {
    1073                 :          0 :         case FMODE_READ:
    1074                 :            :         /*
    1075                 :            :          *  O_RDONLY
    1076                 :            :          *  POSIX.1 says that O_NONBLOCK means return with the FIFO
    1077                 :            :          *  opened, even when there is no process writing the FIFO.
    1078                 :            :          */
    1079                 :          0 :                 pipe->r_counter++;
    1080         [ #  # ]:          0 :                 if (pipe->readers++ == 0)
    1081                 :          0 :                         wake_up_partner(pipe);
    1082                 :            : 
    1083   [ #  #  #  # ]:          0 :                 if (!is_pipe && !pipe->writers) {
    1084         [ #  # ]:          0 :                         if ((filp->f_flags & O_NONBLOCK)) {
    1085                 :            :                                 /* suppress EPOLLHUP until we have
    1086                 :            :                                  * seen a writer */
    1087                 :          0 :                                 filp->f_version = pipe->w_counter;
    1088                 :            :                         } else {
    1089         [ #  # ]:          0 :                                 if (wait_for_partner(pipe, &pipe->w_counter))
    1090                 :          0 :                                         goto err_rd;
    1091                 :            :                         }
    1092                 :            :                 }
    1093                 :            :                 break;
    1094                 :            : 
    1095                 :          0 :         case FMODE_WRITE:
    1096                 :            :         /*
    1097                 :            :          *  O_WRONLY
    1098                 :            :          *  POSIX.1 says that O_NONBLOCK means return -1 with
    1099                 :            :          *  errno=ENXIO when there is no process reading the FIFO.
    1100                 :            :          */
    1101                 :          0 :                 ret = -ENXIO;
    1102   [ #  #  #  #  :          0 :                 if (!is_pipe && (filp->f_flags & O_NONBLOCK) && !pipe->readers)
                   #  # ]
    1103                 :          0 :                         goto err;
    1104                 :            : 
    1105                 :          0 :                 pipe->w_counter++;
    1106         [ #  # ]:          0 :                 if (!pipe->writers++)
    1107                 :          0 :                         wake_up_partner(pipe);
    1108                 :            : 
    1109   [ #  #  #  # ]:          0 :                 if (!is_pipe && !pipe->readers) {
    1110         [ #  # ]:          0 :                         if (wait_for_partner(pipe, &pipe->r_counter))
    1111                 :          0 :                                 goto err_wr;
    1112                 :            :                 }
    1113                 :            :                 break;
    1114                 :            : 
    1115                 :         78 :         case FMODE_READ | FMODE_WRITE:
    1116                 :            :         /*
    1117                 :            :          *  O_RDWR
    1118                 :            :          *  POSIX.1 leaves this case "undefined" when O_NONBLOCK is set.
    1119                 :            :          *  This implementation will NEVER block on a O_RDWR open, since
    1120                 :            :          *  the process can at least talk to itself.
    1121                 :            :          */
    1122                 :            : 
    1123                 :         78 :                 pipe->readers++;
    1124                 :         78 :                 pipe->writers++;
    1125                 :         78 :                 pipe->r_counter++;
    1126                 :         78 :                 pipe->w_counter++;
    1127   [ -  +  -  - ]:         78 :                 if (pipe->readers == 1 || pipe->writers == 1)
    1128                 :         78 :                         wake_up_partner(pipe);
    1129                 :            :                 break;
    1130                 :            : 
    1131                 :          0 :         default:
    1132                 :          0 :                 ret = -EINVAL;
    1133                 :          0 :                 goto err;
    1134                 :            :         }
    1135                 :            : 
    1136                 :            :         /* Ok! */
    1137                 :         78 :         __pipe_unlock(pipe);
    1138                 :         78 :         return 0;
    1139                 :            : 
    1140                 :            : err_rd:
    1141         [ #  # ]:          0 :         if (!--pipe->readers)
    1142                 :          0 :                 wake_up_interruptible(&pipe->wr_wait);
    1143                 :          0 :         ret = -ERESTARTSYS;
    1144                 :          0 :         goto err;
    1145                 :            : 
    1146                 :            : err_wr:
    1147         [ #  # ]:          0 :         if (!--pipe->writers)
    1148                 :          0 :                 wake_up_interruptible_all(&pipe->rd_wait);
    1149                 :          0 :         ret = -ERESTARTSYS;
    1150                 :          0 :         goto err;
    1151                 :            : 
    1152                 :          0 : err:
    1153                 :          0 :         __pipe_unlock(pipe);
    1154                 :            : 
    1155                 :          0 :         put_pipe_info(inode, pipe);
    1156                 :          0 :         return ret;
    1157                 :            : }
    1158                 :            : 
    1159                 :            : const struct file_operations pipefifo_fops = {
    1160                 :            :         .open           = fifo_open,
    1161                 :            :         .llseek         = no_llseek,
    1162                 :            :         .read_iter      = pipe_read,
    1163                 :            :         .write_iter     = pipe_write,
    1164                 :            :         .poll           = pipe_poll,
    1165                 :            :         .unlocked_ioctl = pipe_ioctl,
    1166                 :            :         .release        = pipe_release,
    1167                 :            :         .fasync         = pipe_fasync,
    1168                 :            : };
    1169                 :            : 
    1170                 :            : /*
    1171                 :            :  * Currently we rely on the pipe array holding a power-of-2 number
    1172                 :            :  * of pages. Returns 0 on error.
    1173                 :            :  */
    1174                 :          0 : unsigned int round_pipe_size(unsigned long size)
    1175                 :            : {
    1176         [ #  # ]:          0 :         if (size > (1U << 31))
    1177                 :            :                 return 0;
    1178                 :            : 
    1179                 :            :         /* Minimum pipe size, as required by POSIX */
    1180         [ #  # ]:          0 :         if (size < PAGE_SIZE)
    1181                 :            :                 return PAGE_SIZE;
    1182                 :            : 
    1183   [ #  #  #  #  :          0 :         return roundup_pow_of_two(size);
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
                #  #  # ]
    1184                 :            : }
    1185                 :            : 
    1186                 :            : /*
    1187                 :            :  * Allocate a new array of pipe buffers and copy the info over. Returns the
    1188                 :            :  * pipe size if successful, or return -ERROR on error.
    1189                 :            :  */
    1190                 :          0 : static long pipe_set_size(struct pipe_inode_info *pipe, unsigned long arg)
    1191                 :            : {
    1192                 :          0 :         struct pipe_buffer *bufs;
    1193                 :          0 :         unsigned int size, nr_slots, head, tail, mask, n;
    1194                 :          0 :         unsigned long user_bufs;
    1195                 :          0 :         long ret = 0;
    1196                 :            : 
    1197                 :          0 :         size = round_pipe_size(arg);
    1198                 :          0 :         nr_slots = size >> PAGE_SHIFT;
    1199                 :            : 
    1200         [ #  # ]:          0 :         if (!nr_slots)
    1201                 :            :                 return -EINVAL;
    1202                 :            : 
    1203                 :            :         /*
    1204                 :            :          * If trying to increase the pipe capacity, check that an
    1205                 :            :          * unprivileged user is not trying to exceed various limits
    1206                 :            :          * (soft limit check here, hard limit check just below).
    1207                 :            :          * Decreasing the pipe capacity is always permitted, even
    1208                 :            :          * if the user is currently over a limit.
    1209                 :            :          */
    1210         [ #  # ]:          0 :         if (nr_slots > pipe->ring_size &&
    1211   [ #  #  #  # ]:          0 :                         size > pipe_max_size && !capable(CAP_SYS_RESOURCE))
    1212                 :            :                 return -EPERM;
    1213                 :            : 
    1214                 :          0 :         user_bufs = account_pipe_buffers(pipe->user, pipe->ring_size, nr_slots);
    1215                 :            : 
    1216   [ #  #  #  # ]:          0 :         if (nr_slots > pipe->ring_size &&
    1217         [ #  # ]:          0 :                         (too_many_pipe_buffers_hard(user_bufs) ||
    1218         [ #  # ]:          0 :                          too_many_pipe_buffers_soft(user_bufs)) &&
    1219                 :          0 :                         is_unprivileged_user()) {
    1220                 :          0 :                 ret = -EPERM;
    1221                 :          0 :                 goto out_revert_acct;
    1222                 :            :         }
    1223                 :            : 
    1224                 :            :         /*
    1225                 :            :          * We can shrink the pipe, if arg is greater than the ring occupancy.
    1226                 :            :          * Since we don't expect a lot of shrink+grow operations, just free and
    1227                 :            :          * allocate again like we would do for growing.  If the pipe currently
    1228                 :            :          * contains more buffers than arg, then return busy.
    1229                 :            :          */
    1230                 :          0 :         mask = pipe->ring_size - 1;
    1231                 :          0 :         head = pipe->head;
    1232                 :          0 :         tail = pipe->tail;
    1233         [ #  # ]:          0 :         n = pipe_occupancy(pipe->head, pipe->tail);
    1234         [ #  # ]:          0 :         if (nr_slots < n) {
    1235                 :          0 :                 ret = -EBUSY;
    1236                 :          0 :                 goto out_revert_acct;
    1237                 :            :         }
    1238                 :            : 
    1239                 :          0 :         bufs = kcalloc(nr_slots, sizeof(*bufs),
    1240                 :            :                        GFP_KERNEL_ACCOUNT | __GFP_NOWARN);
    1241         [ #  # ]:          0 :         if (unlikely(!bufs)) {
    1242                 :          0 :                 ret = -ENOMEM;
    1243                 :          0 :                 goto out_revert_acct;
    1244                 :            :         }
    1245                 :            : 
    1246                 :            :         /*
    1247                 :            :          * The pipe array wraps around, so just start the new one at zero
    1248                 :            :          * and adjust the indices.
    1249                 :            :          */
    1250         [ #  # ]:          0 :         if (n > 0) {
    1251                 :          0 :                 unsigned int h = head & mask;
    1252                 :          0 :                 unsigned int t = tail & mask;
    1253         [ #  # ]:          0 :                 if (h > t) {
    1254                 :          0 :                         memcpy(bufs, pipe->bufs + t,
    1255                 :            :                                n * sizeof(struct pipe_buffer));
    1256                 :            :                 } else {
    1257                 :          0 :                         unsigned int tsize = pipe->ring_size - t;
    1258         [ #  # ]:          0 :                         if (h > 0)
    1259                 :          0 :                                 memcpy(bufs + tsize, pipe->bufs,
    1260                 :            :                                        h * sizeof(struct pipe_buffer));
    1261                 :          0 :                         memcpy(bufs, pipe->bufs + t,
    1262                 :            :                                tsize * sizeof(struct pipe_buffer));
    1263                 :            :                 }
    1264                 :            :         }
    1265                 :            : 
    1266                 :          0 :         head = n;
    1267                 :          0 :         tail = 0;
    1268                 :            : 
    1269                 :          0 :         kfree(pipe->bufs);
    1270                 :          0 :         pipe->bufs = bufs;
    1271                 :          0 :         pipe->ring_size = nr_slots;
    1272                 :          0 :         pipe->max_usage = nr_slots;
    1273                 :          0 :         pipe->tail = tail;
    1274                 :          0 :         pipe->head = head;
    1275                 :            : 
    1276                 :            :         /* This might have made more room for writers */
    1277                 :          0 :         wake_up_interruptible(&pipe->wr_wait);
    1278                 :          0 :         return pipe->max_usage * PAGE_SIZE;
    1279                 :            : 
    1280                 :          0 : out_revert_acct:
    1281                 :          0 :         (void) account_pipe_buffers(pipe->user, nr_slots, pipe->ring_size);
    1282                 :          0 :         return ret;
    1283                 :            : }
    1284                 :            : 
    1285                 :            : /*
    1286                 :            :  * After the inode slimming patch, i_pipe/i_bdev/i_cdev share the same
    1287                 :            :  * location, so checking ->i_pipe is not enough to verify that this is a
    1288                 :            :  * pipe.
    1289                 :            :  */
    1290                 :          0 : struct pipe_inode_info *get_pipe_info(struct file *file)
    1291                 :            : {
    1292         [ #  # ]:          0 :         return file->f_op == &pipefifo_fops ? file->private_data : NULL;
    1293                 :            : }
    1294                 :            : 
    1295                 :          0 : long pipe_fcntl(struct file *file, unsigned int cmd, unsigned long arg)
    1296                 :            : {
    1297                 :          0 :         struct pipe_inode_info *pipe;
    1298                 :          0 :         long ret;
    1299                 :            : 
    1300         [ #  # ]:          0 :         pipe = get_pipe_info(file);
    1301         [ #  # ]:          0 :         if (!pipe)
    1302                 :            :                 return -EBADF;
    1303                 :            : 
    1304                 :          0 :         __pipe_lock(pipe);
    1305                 :            : 
    1306      [ #  #  # ]:          0 :         switch (cmd) {
    1307                 :          0 :         case F_SETPIPE_SZ:
    1308                 :          0 :                 ret = pipe_set_size(pipe, arg);
    1309                 :          0 :                 break;
    1310                 :          0 :         case F_GETPIPE_SZ:
    1311                 :          0 :                 ret = pipe->max_usage * PAGE_SIZE;
    1312                 :          0 :                 break;
    1313                 :            :         default:
    1314                 :            :                 ret = -EINVAL;
    1315                 :            :                 break;
    1316                 :            :         }
    1317                 :            : 
    1318                 :          0 :         __pipe_unlock(pipe);
    1319                 :          0 :         return ret;
    1320                 :            : }
    1321                 :            : 
    1322                 :            : static const struct super_operations pipefs_ops = {
    1323                 :            :         .destroy_inode = free_inode_nonrcu,
    1324                 :            :         .statfs = simple_statfs,
    1325                 :            : };
    1326                 :            : 
    1327                 :            : /*
    1328                 :            :  * pipefs should _never_ be mounted by userland - too much of security hassle,
    1329                 :            :  * no real gain from having the whole whorehouse mounted. So we don't need
    1330                 :            :  * any operations on the root directory. However, we need a non-trivial
    1331                 :            :  * d_name - pipe: will go nicely and kill the special-casing in procfs.
    1332                 :            :  */
    1333                 :            : 
    1334                 :         78 : static int pipefs_init_fs_context(struct fs_context *fc)
    1335                 :            : {
    1336                 :         78 :         struct pseudo_fs_context *ctx = init_pseudo(fc, PIPEFS_MAGIC);
    1337         [ +  - ]:         78 :         if (!ctx)
    1338                 :            :                 return -ENOMEM;
    1339                 :         78 :         ctx->ops = &pipefs_ops;
    1340                 :         78 :         ctx->dops = &pipefs_dentry_operations;
    1341                 :         78 :         return 0;
    1342                 :            : }
    1343                 :            : 
    1344                 :            : static struct file_system_type pipe_fs_type = {
    1345                 :            :         .name           = "pipefs",
    1346                 :            :         .init_fs_context = pipefs_init_fs_context,
    1347                 :            :         .kill_sb        = kill_anon_super,
    1348                 :            : };
    1349                 :            : 
    1350                 :         78 : static int __init init_pipe_fs(void)
    1351                 :            : {
    1352                 :         78 :         int err = register_filesystem(&pipe_fs_type);
    1353                 :            : 
    1354         [ +  - ]:         78 :         if (!err) {
    1355                 :         78 :                 pipe_mnt = kern_mount(&pipe_fs_type);
    1356         [ -  + ]:         78 :                 if (IS_ERR(pipe_mnt)) {
    1357                 :          0 :                         err = PTR_ERR(pipe_mnt);
    1358                 :          0 :                         unregister_filesystem(&pipe_fs_type);
    1359                 :            :                 }
    1360                 :            :         }
    1361                 :         78 :         return err;
    1362                 :            : }
    1363                 :            : 
    1364                 :            : fs_initcall(init_pipe_fs);

Generated by: LCOV version 1.14